Text mining исследует актуальность и значимость одного из важнейших культурных деятелей 20 века — Сергея Павловича Дягилева. Для данного исследования был использован текст книги Наталии Дмитриевны Чернышовой-Мельник «Дягилев». Сергей Павлович входил в число основателей группы «Мир Искусства», был организатором «Русских сезонов» в Париже и труппы «Русский балет Дягилева». Он повлиял на становление культуры в Перми, в частности, на становление изобразительного искусства в 1898—1906 годы и музыкального театра в 1906—1929 годы.
На данном этапе работы будет проведен анализ текстов с помощью следующих инструментов:
Voyant tools
Этот ресурс позволяет анализировать и визуализировать текст. Он способен выстраивать облака наиболее часто используемых слов в контексте. Более того, при наведении на определенное слово можно узнать точное количество упоминаний слов в тексте. Как мы видим, в облаке слов наиболее часто упоминаемые это Дягилев, балет, русский, Сергей.
Также, с помощью этого ресурса можно отслеживать количество повторений слова на протяжении всего произведения, что помогает увидеть, в каком сегменте текста слово использовали часто, а в каком гораздо реже. В нашем случае заметно, что фамилия «Дягилев» достаточно равномерно употребляется на протяжении всего текста, слово «балет» доходит до своего пика в середине карьеры деятеля. «Сезоны» становятся значимыми с середины и до конца жизни. Слово импрессарио идет на спад также к концу жизни деятеля, однако маэстро возрастает к концу. Театр также достаточно равномерно распределён.
Google Books Ngram Viewer
Данный анализ направлен на изучение интереса общественности к личности С. П. Дягилева через частоту употребления его фамилии в течение двадцатого и двадцать первого веков.
Text analyzer
Для того, чтобы провести более качественный анализ, мы решили поделить текст на две части. Первая часть рассказывает нам о Дягилеве, его семье, начале его карьеры.
Во второй части говорится о пике карьеры Дягилева и конце его жизни.
Работу выполнили: Мартюшева Ю. А., Порываева М. С.