Анализ отрывка текста про меценатство в Перми конца XIX

Анализ выполнили:

Ибрагимова Татьяна,

Качмашева Екатерина

Для проведения анализа был использован отрывок из учебного пособия «История и культура Урала до конца XIX века». Нас заинтересована данная тема, поскольку благотворительность – явление относительно новое. Мы более сузили это направление и остановились на конкретной губернии, а точнее губернском городе – Пермь.

Для проведения исследования были использованы три ресурса:

  • Voyant Tools; ·
  • Ngram Viewer; ·
  • Online Utility Text Analyzer.
VOYANT TOOLS

Отрывок из пособия был загружен на сайт https://voyant-tools. Уникальность ресурса в том, что он не только показывает облако из самых популярных слов, но и наглядно показывает оригинальность словоформ в тексте. Для начала мы провели лемматизацию текста — процесс приведения словоформы к лемме — её нормальной (словарной) форме.

Документ состоит из 7026 слов и 1861 уникальных словоформ.
Наиболее частотные слова: общество (101); рубль (57); пожертвование (54); пермский (46); средство (44). Их можно заметить в облаке слов, представленном ниже:

Бегунком можно менять размеры облака. Попробуйте 😉

График показывает частотность слов в тексте. Таким образом, мы можем увидеть, что чаще всего употребляется слова общество, пожертвование и рубль.

NGRAM VIEWER

Мы использовали этот сервис, чтобы узнать, как часто в литературе с 1800 по 2008 гг. встречаются слова «благотворительность» и «меценатство». Указав их в строке поиска, мы получили следующие результаты:

Как можно заметить в период с 1800 по 2008 гг. слово «благотворительность» встречается очень часто, временами достигая очень высокого процента встречаемости. Спад популярности этой темы заметен с 1920-х гг. по 1980-е гг., после чего вопрос о благотворительности снова начал становиться популярным в литературе. Другая картина видна со словом «меценатство». Как можно заметить, оно не популярно и достигает максимального процента в 1880х-1890х гг. (примерно 7%), после чего не превышает 2% встречаемости. Однако в 1860х процент достигает 6.

ONLINE UTILITY TEXT ANALYZER

После загрузки фрагмента пособия на сайт мы получили следующие результаты:

Как можно увидеть, помимо стандартных характеристик текста, как, например, число символов с пробелами и без них, данный инструмент рассчитывает количество слогов, что не встречается среди аналогичных технологических решений, а также коэффициент лексической плотности (Lexical Density), который является отличной отличительной чертой лексически богатого текста и демонстрирует уровень владения автора языком.

Топ-10 повторяющихся словоформ в тексте

Кроме того, Text Analyzer способен не только отыскать наиболее часто встречающиеся слова, но и проделать то же самое с целыми фразами, содержащими от двух до восьми слов.

ТЫК И ВЫ НА ГЛАВНОЙ СТРАНИЦЕ