Анализ романа Л. Н. Толстого «Анна Каренина»

В данном проекте анализируется творчество Л. Н. Толстого на основе одного из его произведений — романа Анна Каренина. Благодаря этому проекту нам удалось познакомиться с творчеством автора не только посредством чтения, но и инструментов визуализации текста.

Работу выполнили студентки И-19-1 Мария Андриянова и Анна Костарева.
Для проведения исследования был выбран ресурс Voyant.tools (https://voyant-tools.org/)

В работе были применены следующие инструменты отображения: облако слов, текст-майнинг, кластеризация, termsberry.

После загрузки текста были получены следующие результаты:

  1. 10 наиболее встречаемых слов в романе: сказал (1332), левин (1008), сказала (757), кити (582), очень (541), ли (514), ну (508), анна (468), ничего (440), вронский (429). Исходя из этих данных можно сделать вывод, кто является главными героями романа Толстого.
  2. Среднее число слов в одном предложении — 18.3.
  3. Облако слов включает в себя более 10 наиболее встречаемых слов в тексте романа. К ним добавляются имена второстепенных персонажей, слова-синонимы «сказал/сказала» и прочие.
  4. В романе достаточно часто можно встретить слова и реплики на французском, что также видно при помощи кластеризации.
  5. Программа Voyant.tools позволяет проследить встречаемость разных героев как главных, так и второстепенных на протяжении всего романа.

График наиболее встречаемых слов на протяжении всего романа

Текст-майнинг: наиболее встречаемые слова в романе

 

Кластеризация

Termsberry

Облако слов

График встречаемости имени «аркадьич»