Цель лабораторной работы:
Анализ и визуализация текста про политический анекдот в России конца XX века.
Задачи:
1. Обработать текст, используя необходимые для этого ресурсы.
2. Описать полученные результаты.
3. Предоставить полученные результаты на проверку.
Использованные ресурсы:
1. AntConc
2. Voyant tools
Источник: М. Алексеевский «Анекдоты от Зюганова: фольклор в современной политической борьбе»
AntConc
После загрузки нужного текста в программу, был получен такой результат:
(рис.1 Результаты анализа текста в программе AntConc)
Игнорируя различного рода междометия, предлоги и союзы, можно выделить следующие наиболее часто используемые слова: «анекдот» (и его производные (62,52,27)), «лужков» (14), «фольклор» (7), «интернет» (6) (данные по последним трём словам из списка были указаны ниже, чем приведённые на рисунке примеры слов, следовательно, на нём [рисунке] результат не виден).
Далее можно рассмотреть в каких частях текста наиболее часто употребляется слово «анекдот»:
(рис.2 Наиболее частое употребление слова «анекдот»)
Ниже представлен результат такой операции, как Clusters/N-Grams для слова «лужков»:
(рис.3 Наиболее часто употребляемые пары со словом «лужков»)
Анализируя вышеуказанные результаты, можно выявить, что всё же наиболее часто употребляемым персонажем в политических анекдотах конца XX века в России был Ю. М. Лужков. И это неспроста: именно в период с 1992 года по 2010 год Юрий Михайлович был мэром Москвы. Более того, многие его действия осмеивались в постсоветском обществе (как раз таки посредством анекдотов).
Voyant tools
(рис.4 Облако слов, созданное по результатам анализа текста в программе Voyant tools)
(рис.5 Схема связи между наиболее распространёнными словами)
Таким образом, можно сказать, что для анализа текста доступно большое количество программ, которые работают по-разному: например, создают облака слов (как Voyant Tools), или же ищут часто используемые слова (как AntConc). Однако это лишь малая часть доступных нам ресурсов.