Лабораторная работа 1. Анализ текста.

Коми-Пермяки — народ финно-угорской группы, проживающий в России. До 1920-х гг. называли себя пермичами, пермянами. В настоящее время используется этноним коми-пермяки. Проживают на северо-западе Пермского края: на территории административно-территориального образования в составе края — Коми-Пермяцкого округа, в Красновишерском муниципальном районе, по реке Язьве — язьвинские пермяки, в Кировской области — зюздинские пермяки. На реках Иньва и Нердва — иньвенские коми-пермяки.

В  работе были использованы такие  сервисы, как:

  1. Voyant tools
  2. Online utility text analyzer
  3. AntConc

Voyant tools

Данная программа позволяет выявить самые часто употребляющиеся слова в статье «Коми-Пермяки.» Одним из часто  употребляемых слов является слово «культура». Далее можно сделать вывод о том, что в данной статье больше внимания уделено именно  культуре, языку коми-пермяков. Также, на мой взгляд, стоит упомянуть слово «пермяк». Автор статьи использовал данное слово в качестве подробного описания жизнедеятельности данного народа.

Облако статьи про коми-пермяков.

В данном облаке изображены частоты употребления слов «век», «культура», «народ», «пермяк», «язык». Таким образом, стоит сделать вывод о том, что частоты слов, которые были уже упомянуты, меняются на протяжении всего отрезка, указанного выше. В начале статьи чаще всего употребляются слова «век», «народ», «культура», «язык», но, затем, их частотность  постепенно падает. Что нельзя сказать о слове «пермяк», у которого частота использования достигла максимального пика только в конце статьи про коми-пермяков, но затем, все равно спала. Из этого следует, что в статье основной темой является тема про культуру и язык коми-пермяков.

Online utility text analyzer

Данный сервис помогает узнать частоту использования того или иного словосочетания в статье.

Рис. 1. 18 фраз, которые чаще всего встречаются в статье «Коми-Пермяки.»

       AntConc

Это приложение помогает проанализировать статью или произведение и выявить там самые часто употребляемые слова.

Рис. 2. Самые популярные слова в статье про коми-пермяков.

Выше можно увидеть самый популярный предлог «В», который встречается 168 раз. Помимо предлогов, в AntConc также как и в Voyant tools изображаются слова «народ», «пермяк», «язык», «культура».  Опираясь на данные, которые показаны в скриншоте, можно понять, что в статье чаще говорится о культуре коми-пермяков.

Рис. 3. Данная функция помогает рассмотреть как распределены слова в текстах.

Можно сказать, что слово «пермяк» чаще всего встречается в начале и в конце статьи.

Рис. 4. Еще при помощи этого приложения также можно выявить словоформы, которые используются с важным ключевым словом.

В таком случае, у меня появились следующие словоформы. Приведу в пример прилагательные, используемые с важным ключевым словом: «Язвиньский пермяк», «Зюздинский пермяк», «Гайинский пермяк», «Коренной пермяк» и т.д. Из этого следует, что с помощью этого приложения можно узнать на какие виды подразделяются коми-пермяки.

Рис. 5. Самые частотные биграммы в статье «Коми-пермяки»

Самое часто встречающиеся слова это  «пермский» и «край».

Таким образом, делая итог по всему вышесказанному и описанному, можно сказать, что сделан текстовый анализ, по которому можно выявить самые часто употребляемые слова в статьях или же в произведениях и понять, что автор чаще всего использует в интерпретации своей речи.

Источники:

https://xn--74-6kcq7bhn4g.xn--p1ai/stati/narodyi/ko%CC%81mi-permyaki%CC%81.html