Лабораторная работа №1 (Тексты)

В данной работе анализируется курсовая работа “Состав, социокультурный облик и деятельность членов общества бывших политкаторжан и ссыльнопоселенцев (1921-1935 гг.)”, написанная студентом второго курса Зиньковским Сергеем. Данная работа анализирует Пермскую группу общества бывших политкаторжан и ссыльнопоселенцев, а также её деятельность.

Для анализа произведений были использованы инструменты:

  1. Voyant tools
  2. Google books ngram viewer 
  3. Online utility text analyzer

Первым используемым инструментом является VOYANT TOOLS

Данный инструмент позволяет установить часто используемые слова, а также их точное значение. Самые часто используемые слова: группы (124); пермской (85); общества (71); также (59). Частота первых трех слов связана с темой курсовой работы, а слово “также” часто использовалось автором в качестве связки составных частей сложного предложения.

Рис. 1 Облако слов курсовой работы (100 самых используемых)

 

Помимо производных от уже упомянутых слов, на рисунке можно заметить использование таких слов, как “члены” “организация” “деятельность” и другие.

Рис. 2 Тенденции использования слов в курсовой.

Вторым используемым инструментом является GOOGLE BOOKS NGRAM VIEWER

Данный инструмент был использован для изучения интереса общественности к обществу бывших политкаторжан и ссыльнопоселенцев.

Рис. 3 График использования словосочетания » Общество бывших политкаторжан и ссыльнопоселенцев » в России

Интерес к данному обществу начинает расти с 1960 годы и резко возрастает в период перестройки, однако после распада СССР интерес к обществу постепенно падает, не смотря на резкий рост интереса на рубеже тысячелетия.

Третьим используемым инструментом является TEXT ANALYZER

Данный инструмент поможет нам провести анализ текста. Также для сравнения будет приведена статистика Word по данному тексту.

Рис. 4 Анализ текста в TEXT ANALYZER

Рис 5. Анализ текста в WORD

Статистика

WORD TEXT ANALYZER
Слов 6651 6649
Знаков (без пробелов) 41048 39369
Знаков (с пробелами ) 47295 47939

 

Можно обратить снимание, что если количество слов и знаком с учетом пробелов практически одинаково, то подсчет количества знаком без учета пробелов отличается достаточно сильно.