Text mining. Анализ статьи о театральной жизни Перми в XX веке

Тема статьи нашего исследования связана с историей развития театров г. Перми в XX в. Сама статья состоит из 3 небольших статей кандидата культурологических наук Ивинских Г. П.:
Статья «Пермь театральная в первое послереволюционное десятилетие (1917-1927)»;
Статья «Пермь театральная и культурная в годы войны (1941-1945)»;
Статья «Театр и зрители: отношения на длинных дистанциях».

0. Google Translate (https://translate.google.ru/#en/ru/

Основной проблемой исследования была невозможность работы программного обеспечения с текстами на русском языке. Анализ проводился на переведённом варианте с помощью Google Translate, поэтому трудно говорить о высокой точности перевода. Однако данное приложение можно считать одним из видов анализаторов. По-крайней мере, чешский исследователь в сфере Text Mining Петра Галушчакова выделяет такой вид приложений как Machine Translation.

Рис. 1 Перевод текста в Google Translate

I. Headline Sentiment Analyzer (http://www.aminstitute.com/cgi-bin/headline.cgi)

Рис. 2 Анализ заголовка в Headline Sentiment Analyzer

Первый анализ был проведён с целью выяснения эмоциональной составляющей темы (заголовка) статьи. С помощью специального критерия EMV (Emotional Marketing Value) было определено, что ценность данного заголовка составляет 28,57%. Это значит, что в заголовке содержатся слова, носящие какую-либо эмоциональную окраску.

В данном случае этот эмоциональный окрас носит интеллектуальный характер, то есть, как объясняется ниже, слова, содержащиеся в заголовке, относятся к интеллектуальной сфере исследования. Эти слова наиболее часто используются людьми. Они доступны и понятны. Оказывают положительное влияние на людей, воспринимающих данную информацию. Наш взгляд, таким словами в заголовке являлись development (развитие) и history (история).

II. Text Analyzer (https://www.online-utility.org/text/analyzer.jsp)

Рис. 3 Анализ текста в Text Analyzer

Первый анализатор показал нам краткую статистику по содержанию статьи. Можно заметить, что анализируемый текст содержит около 31,5 тыс. знако (включая пробелы) и 25 тыс. (без них). Весь текст состоит из 279 предложений, 5199 слов и 8630 слогов, причём лексическая плотность составляет 31%, что, на наш взгляд, является хорошим показателем для содержания научных статей.

III. Online-summarize tool (https://www.tools4noobs.com/summarize/)

Следующий инструмент-анализатор был использован для подведения основных итогов данной статьи. Было выделено 11 основных пунктов. Результат оказался таков:

Рис. 4. Основные идеи статьи с помощью Online-Summarize Tool

Перевод:

  1. Всего эти бригады, сформированные из артистов театра драмы, Ленинградского и Пермского театров оперы балета, филармонии, дали за годы войны более 600 концертов на передовых позициях под Москвой, на Северо-Западном, Центральном и Украинском фронтах.
  2. Если в конце XIX века Пермь была практически единственным провинциальным городом российской империи, где театр содержался за счет городского бюджета, то в сложнейших условиях Гражданской войны государство берет на себя обязательство субсидировать практически все театры страны, правда, с оговоркой, — «признаваемые полезными и художественными».
  3. Театр и зрители: отношения на длинных дистанциях(на примере театральной жизни Перми XIX – XX веков и начала XXI столетия). Особенность региональной публики в ее многолетнем общении со «своим» театром состоит в относительном постоянстве состава, зачастую личном знакомстве с режиссером, артистами и друг с другом.
  4. Но лишь один театральный коллектив – пермский театр рабочей молодежи, (ТРАМ), возникший в 1927 г. (первый на Урале и четвертый в стране театр подобного типа) стал основанием одного из старейших театров Урала – Пермского академического театра драмы.
  5. Кстати, труд — «Очерки по истории русского драматического театра» был написан С. С. Даниловым в Перми и здесь же в 1944 году впервые издан (на газетной бумаге тиражом всего 160 экземпляров).
  6. Театр драмы, как и другие театры, работавшие в Перми в военные годы, стали необходимой составляющей, дающей дополнительные силы жить, работать, ждать своих родных и надеяться.
  7. Уроженец Перми Г. И. Бурков, будущий известный актер, вспоминая военные годы (он был тогда подростком) писал: «Я рос на опере и балете Ленинградского театра имени Кирова.
  8. В первые месяцы войны в Пермь были эвакуированы не только промышленные предприятия, но и творческие коллективы: Ленинградский театр оперы и балета.
  9. С большим вниманием было воспринято выступление театроведа, историка театра С. С. Мокульского на тему «Задачи и перспективы дальнейшего развития художественной культуры Урала». К этой конференции сотрудники Пермской художественной галереи подготовили большую выставку произведений XIII — XX веков, рассказывающих об Урале.
  10. По итогам этого смотра были отмечены два спектакля Пермского драматического театра: «Горе от ума» в постановке ленинградского режиссера А. Б. Винера с Ю. В. Городецким в роли Чацкого и «Егор Булычов и другие», режиссером которого и исполнителем главной роли был И. С. Ефремов.
  11. Пермский театр оперы и балета, (до реэвакуации Ленинградского театра, начавшейся в конце мая 1944 г.) фактически был передвижным.

В итоге стоит сделать вывод, что данный инструмент не полностью идеален, но в основном большинство мыслей статьи было отмечено верно.

IV. WordItOut (https://worditout.com/word-cloud/create)

Рис. 5 Облако из слов в WordItOut

В качестве последнего логического шага был визуализирован вывод, полученный в предыдущем исследовании. Несмотря на то, что вывод был не совсем идеальный, человек, не читавший данную статью, может понять историческую направленность статьи по ключевым словам theater, opera, balet, Ural, history, Moscow and etc. (театр, опера, балет, Урал, история, Москва и т. д.), отражённым на этом визуализированном словесном облаке (Word Cloud).

В целом, подводя итог проделанной работы, по выбранной теме проведён ряд анализов текста в онлайн-анализаторах, которые, так или иначе, представляют актуальную информацию о нём. Есть определённые недостатки, но для однозадачных анализаторов это не так уж и плохо. Единственное, что хотелось бы отметить, это отсутствие качественных русских аналогов подобных программ.

← Вернуться на главную страницу