Анализ выполнили:
Ибрагимова Татьяна,
Качмашева Екатерина
Для проведения анализа был использован отрывок из учебного пособия «История и культура Урала до конца XIX века». Нас заинтересована данная тема, поскольку благотворительность – явление относительно новое. Мы более сузили это направление и остановились на конкретной губернии, а точнее губернском городе – Пермь.
Для проведения исследования были использованы три ресурса:
- Voyant Tools; ·
- Ngram Viewer; ·
- Online Utility Text Analyzer.
VOYANT TOOLS
Отрывок из пособия был загружен на сайт https://voyant-tools. Уникальность ресурса в том, что он не только показывает облако из самых популярных слов, но и наглядно показывает оригинальность словоформ в тексте. Для начала мы провели лемматизацию текста — процесс приведения словоформы к лемме — её нормальной (словарной) форме.
Документ состоит из 7026 слов и 1861 уникальных словоформ.
Наиболее частотные слова: общество (101); рубль (57); пожертвование (54); пермский (46); средство (44). Их можно заметить в облаке слов, представленном ниже:
Бегунком можно менять размеры облака. Попробуйте 😉
График показывает частотность слов в тексте. Таким образом, мы можем увидеть, что чаще всего употребляется слова общество, пожертвование и рубль.
NGRAM VIEWER
Мы использовали этот сервис, чтобы узнать, как часто в литературе с 1800 по 2008 гг. встречаются слова «благотворительность» и «меценатство». Указав их в строке поиска, мы получили следующие результаты:
Как можно заметить в период с 1800 по 2008 гг. слово «благотворительность» встречается очень часто, временами достигая очень высокого процента встречаемости. Спад популярности этой темы заметен с 1920-х гг. по 1980-е гг., после чего вопрос о благотворительности снова начал становиться популярным в литературе. Другая картина видна со словом «меценатство». Как можно заметить, оно не популярно и достигает максимального процента в 1880х-1890х гг. (примерно 7%), после чего не превышает 2% встречаемости. Однако в 1860х процент достигает 6.
ONLINE UTILITY TEXT ANALYZER
После загрузки фрагмента пособия на сайт мы получили следующие результаты:
Как можно увидеть, помимо стандартных характеристик текста, как, например, число символов с пробелами и без них, данный инструмент рассчитывает количество слогов, что не встречается среди аналогичных технологических решений, а также коэффициент лексической плотности (Lexical Density), который является отличной отличительной чертой лексически богатого текста и демонстрирует уровень владения автора языком.
Топ-10 повторяющихся словоформ в тексте
Кроме того, Text Analyzer способен не только отыскать наиболее часто встречающиеся слова, но и проделать то же самое с целыми фразами, содержащими от двух до восьми слов.