Применение инструментов Text Mining для сравнительного анализа Положений о земском самоуправлении 1864 г. и 1890 г.

Для текстового анализа Положения о губернских и уездных земских учреждениях и временных для них Правил по делам о земских повинностях, народном продовольствии и общественном призрении 1864 г. и Положения о земских учреждениях 1890 г. оптимально использовать следующие сервисы:

В первую очередь мы использовали лемматизатор текста bez-bubna, который позволил привести все слова на русском языке к начальной форме. С учётом специфики текста дополнительно пришлось часть слов («земския», «земских») привести к начальной форме через автозамены в Word. Это позволило нам уточнить стилометрический анализ текста.

В исправленной форме мы поместили текст в сервис voyant-tools. Он позволил нам выделить тренды использования основных слов тексте. Для этого текст был разделен на 10 равных сегментов, для каждого из которых была отмечена частота использования ключевых слов. Для обоих законодательных актов наиболее употребляемым стало слово»земский». Однако во втором документе среди часто встречаемых также было слово «губернатор», которое мы тоже отметили на графике. результаты представлены на рисунках 1 и 2.

Рисунок № 1. Тренды использования слов в тексте Положения 1864 г.

Рисунок № 2. Тренды использования слов в Положении 1890 г.

Сервис voyant-tools позволил также выстроить связи для наиболее употребляемого слова в обоих текстах. На рисунках 3 и 4 мы видим, что наиболее употребляемые связки слов оказались аналогичными в обоих законодательных актах.

Рисунок № 3. Связи слов в Положении 1864 г.

Рисунок №4. Связи слов в Положении 1890 г.

 

В качестве средства визуализации полученных данных мы можем использовать сервис Wordsift. Он позволяет выделить наиболее употребляемые слова и визуализировать их в виде облака:

Рисунок № 5. Облако слов «Положение 1864 г.»

Рисунок №6. Облако слов «Положение 1890 г.»

 

Как видно из сравнения двух  облаков, во втором издании законов о земском самоуправлении среди наиболее употребляемых слов стали встречаться термины, которые относятся к государственной власти (губернатор, присутствие). На первом облаке с визуализацией анализа таких слов среди наиболее употребляемых мы не видим. Это говорит нам о возросшем контроле со стороны государственной власти.

Таким образом, проведенный анализ средствами Text Mining позволяет нам сделать выводы о существенно возросшем влиянии губернатора и государственной власти на органы земского самоуправления в Положении о губернских и уездных земский учреждениях 1890 г. по сравнению  с более ранним Положением о губернских и уездных земский учреждениях 1864 г.