Анализ текста

Цель лабораторной работы:
Анализ и визуализация текста про политический анекдот в России конца XX века.

Задачи:
1. Обработать текст, используя необходимые для этого ресурсы.
2. Описать полученные результаты.
3. Предоставить полученные результаты на проверку.

Использованные ресурсы:
1. AntConc
2. Voyant tools

Источник: М. Алексеевский «Анекдоты от Зюганова: фольклор в современной политической борьбе»

AntConc

После загрузки нужного текста в программу, был получен такой результат:


(рис.1 Результаты анализа текста в программе AntConc)

Игнорируя различного рода междометия, предлоги и союзы, можно выделить следующие наиболее часто используемые слова: «анекдот» (и его производные (62,52,27)), «лужков» (14), «фольклор» (7), «интернет» (6) (данные по последним трём словам из списка были указаны ниже, чем приведённые на рисунке примеры слов, следовательно, на нём [рисунке] результат не виден).

Далее можно рассмотреть в каких частях текста наиболее часто употребляется слово «анекдот»:


(рис.2 Наиболее частое употребление слова «анекдот»)

Ниже представлен результат такой операции, как Clusters/N-Grams для слова «лужков»:


(рис.3 Наиболее часто употребляемые пары со словом «лужков»)

Анализируя вышеуказанные результаты, можно выявить, что всё же наиболее часто употребляемым персонажем в политических анекдотах конца XX века в России был Ю. М. Лужков. И это неспроста: именно в период с 1992 года по 2010 год Юрий Михайлович был мэром Москвы. Более того, многие его действия осмеивались в постсоветском обществе (как раз таки посредством анекдотов).

 

 Voyant tools

(рис.4 Облако слов, созданное по результатам анализа текста в программе Voyant tools)


(рис.5 Схема связи между наиболее распространёнными словами)

 

Таким образом, можно сказать, что для анализа текста доступно большое количество программ, которые работают по-разному: например, создают облака слов (как Voyant Tools), или же ищут часто используемые слова (как AntConc). Однако это лишь малая часть доступных нам ресурсов.