Анализ книги-биографии о судьбе Дягилева С. П.

Источник: https://24smi.org/celebrity/5075-sergei-diagilev.html

Text mining исследует актуальность и значимость одного из важнейших культурных деятелей 20 века — Сергея Павловича Дягилева. Для данного исследования был использован текст книги Наталии Дмитриевны Чернышовой-Мельник «Дягилев». Сергей Павлович входил в число  основателей группы «Мир Искусства», был организатором «Русских сезонов» в Париже и труппы «Русский балет Дягилева». Он повлиял на становление культуры в Перми, в частности, на становление изобразительного искусства в 1898—1906 годы и музыкального театра в 1906—1929 годы.

На данном этапе работы будет проведен анализ текстов с помощью следующих инструментов:

  1. Voyant tools
  2. Google books ngram viewer 
  3. Online utility text analyzer

Voyant tools

Этот ресурс позволяет анализировать и визуализировать текст. Он способен выстраивать облака наиболее часто используемых слов в контексте. Более того, при наведении на определенное слово можно узнать точное количество упоминаний слов в тексте. Как мы видим, в облаке слов наиболее часто упоминаемые это Дягилев, балет, русский, Сергей.

Рис. 1. Облако слов, сделанное при помощи «Voyant tools» по книге-биографии «Дягилев»

Также, с помощью этого ресурса можно отслеживать количество повторений слова на протяжении всего произведения, что помогает увидеть, в каком сегменте текста слово использовали часто, а в каком гораздо реже. В нашем случае заметно, что фамилия «Дягилев» достаточно равномерно употребляется на протяжении всего текста,  слово «балет» доходит до своего пика в середине карьеры деятеля. «Сезоны» становятся значимыми с середины и до конца жизни. Слово импрессарио идет на спад также к концу жизни деятеля, однако маэстро возрастает к концу. Театр также достаточно равномерно распределён.

Рис. 2. Тренды слов в произведении. Рис. 3. Bubblines по произведению, частота слов на протяжении всей книги

Google Books Ngram Viewer

Данный анализ направлен на изучение интереса общественности к личности С. П. Дягилева через частоту употребления его фамилии в течение двадцатого и двадцать первого веков.

Рис. 5. График частоты использования словосочетания «Сергей Дягилев» в корпусе Gppgle Books

Text analyzer

Для того, чтобы провести более качественный анализ, мы решили поделить текст на две части. Первая часть рассказывает нам о Дягилеве, его семье, начале его карьеры.

Рис. 6. Анализ первой части при помощи Text Analyzer

Рис. 7. Топ-фраз, содержащих 7 и 6 слов

Во второй части говорится о пике карьеры Дягилева и конце его жизни.

Рис. 8. Анализ второй части

Рис. 9. Топ-фраз, содержащих 7 и 8 слов

Работу выполнили: Мартюшева Ю. А., Порываева М. С.