Лабораторная 1

Данная работа позволила провести контент — анализ 10 отобранных произведений В.В. Маяковского, а именно: «Ночь», «Нате!», «Мама и убитый немцами вечер», «Лиличка»,  «Облако в штанах», «Приказ по армии искусства», «Хорошо», «Человек», «Владимир Ильич Ленин», «Мы». На основе полученных результатов будут сделаны соответствующие выводы о том, как образ улицы в произведениях этого автора отображается посредством слов, и какие слова могут дать представление о том, что образ улицы в произведениях В.В. Маяковского действительно играет значимую роль.

Для проведения контент — анализа этих 10 произведений были использованы следующие сервисы:

1)Ant Conc

2)Voyant tools

AntConc

Это приложение позволяет проанализировать все слова, которые содержатся в тексте, и выявить наиболее популярные и ключевые слова.

рис. 1   топ 15 ключевых слов в 10 отобранных произведениях В.В. Маяковского

Для начала, стоит сказать, что чаще всего в этих произведениях встречаются служебные части речи, а именно предлоги и союзы. На основе этих данных невозможно сделать выводы о том, каким предстает образ улицы в произведениях В.В. Маяковского и какую роль играет этот образ.

Именно поэтому стоит опираться на данные полученные в ходе отбора ключевых слов. В соответствии с данными таблицы, можно сделать вывод о том, что ключевыми словами, встречающимися в отобранных произведениях В.В. Маяковского являются: Ленин, мочь, вставать, идти, рука, становиться, глаз, рабочий, хотеть, подымать, земля, партия, улица, Ильич, красный.  Таким образом, слово «улица» входит в топ-15 ключевых слов для 10 произведений В.В. Маяковского — то есть, этот образ довольно часто фигурирует во многих произведениях данного автора, а значит, образ «улицы» можно назвать ключевым для творчества В.В. Маяковского. Также слова «идти» и «земля» могут употребляться в рамках описания улицы — поэтому их частое употребление в произведениях В.В. Маяковского также говорит о том, что образ улицы является значимым для творчества данного автора. Что касается остальных слов, например: «Ильич», «Ленин», «Партия» и «Красный», то стоит сказать, что эти слова подчеркивают характерные темы, которые поднимает в своих произведениях В.В. Маяковский (темы коммунизма, пролетариата и В.И. Ленина). Таким образом, анализ ключевых слов 10 отобранных произведений В.В. Маяковского показал, что образ улицы действительно часто фигурирует в творчестве данного автора и является значимым для его произведений.

Voaynt Tools

Данный сервис также позволяет выявить наиболее часто встречающиеся слова в тексте: в данном случае, в 10 отобранных произведениях В.В. Маяковского

Облако наиболее часто встречающихся слов в 10 отобранных произведениях В.В. Маяковского

Данный сервис позволяет определить, какие слова встречались в тексте наиболее часто. В данном случае, таковыми являются слова: Ленин, идти, глаз, каждый, рука, земля, улица, выходить, стоять и другие. Так, среди наиболее часто встречающихся слов в 10 отобранных произведениях В.В. Маяковского опять можно встретить те слова, которые обычно употребляются вместе со словом «улица»: выходить, идти, стоять, земля. То есть, можно вновь сделать вывод о том, что образ улицы и описание улицы довольно часто встречаются в творчестве В.В. Маяковского. Более того, среди наиболее часто встречающихся в отобранных произведениях слов есть и само слово «улица», что говорит о значимости этого образа для творчества В.В. Маяковского в целом. Конечно же, также часто встречаются слова, связанные с другими, не менее популярными для творчества В.В. Маяковского, темами: например, «Ленин». Таким образом, можно сделать вывод о том, что образ улицы действительно играет значимую роль в творчестве этого автора.

График частоты употребления наиболее популярных слов в 10 отобранных произведениях В.В. Маяковского

Данный сервис позволяет увидеть, сколько раз встречаются в текстах 10 отобранных произведений В.В. Маяковского самые часто встречающиеся слова. Так, на основании данных графика, можно сделать вывод о том, что слово «идти» встречается чаще остальных слов, а именно 57 раз. Стоит отметить, что слово «идти» обычно употребляется в контексте описания движения по улице — значит, наиболее часто в текстах отобранных произведений встречается слово, которое обычно используется в контексте описания улицы. Это говорит о том, что улица и движение по городской улице действительно имеет большое значение для творчества В.В. Маяковского. Также, 37 раз встречается еще одно слово, которое чаще всего употребляется в контексте описания улицы — земля. Безусловно, частотой употребления в произведениях В.В. Маяковского отличается слово «Ленин»: это в очередной раз показывает, что В.В. Маяковский в своем творчестве часто обращался к теме коммунизма. Таким образом, на основании данных этого графика следует сделать выводы о том, что образ улицы действительно часто встречается в произведениях В.В. Маяковского, а также в произведениях этого автора часто можно столкнуться с тематикой коммунизма.

Источники:

«Ночь», В.В. Маяковский

«Нате!», В.В. Маяковский

«Мама и убитый немцами вечер», В.В. Маяковский

«Лиличка (вместо письма)», В.В. Маяковский 

«Облако в штанах», В.В. Маяковский 

«Приказ по армии искусства», В.В. Маяковский

«Хорошо», В.В. Маяковский 

«Человек», В.В. Маяковский 

«Владимир Ильич Ленин», В.В. Маяковский 

«Мы», В.В. Маяковский  

 

Лабораторная работа 1. Анализ текста.

Коми-Пермяки — народ финно-угорской группы, проживающий в России. До 1920-х гг. называли себя пермичами, пермянами. В настоящее время используется этноним коми-пермяки. Проживают на северо-западе Пермского края: на территории административно-территориального образования в составе края — Коми-Пермяцкого округа, в Красновишерском муниципальном районе, по реке Язьве — язьвинские пермяки, в Кировской области — зюздинские пермяки. На реках Иньва и Нердва — иньвенские коми-пермяки.

В  работе были использованы такие  сервисы, как:

  1. Voyant tools
  2. Online utility text analyzer
  3. AntConc

Voyant tools

Данная программа позволяет выявить самые часто употребляющиеся слова в статье «Коми-Пермяки.» Одним из часто  употребляемых слов является слово «культура». Далее можно сделать вывод о том, что в данной статье больше внимания уделено именно  культуре, языку коми-пермяков. Также, на мой взгляд, стоит упомянуть слово «пермяк». Автор статьи использовал данное слово в качестве подробного описания жизнедеятельности данного народа.

Облако статьи про коми-пермяков.

В данном облаке изображены частоты употребления слов «век», «культура», «народ», «пермяк», «язык». Таким образом, стоит сделать вывод о том, что частоты слов, которые были уже упомянуты, меняются на протяжении всего отрезка, указанного выше. В начале статьи чаще всего употребляются слова «век», «народ», «культура», «язык», но, затем, их частотность  постепенно падает. Что нельзя сказать о слове «пермяк», у которого частота использования достигла максимального пика только в конце статьи про коми-пермяков, но затем, все равно спала. Из этого следует, что в статье основной темой является тема про культуру и язык коми-пермяков.

Online utility text analyzer

Данный сервис помогает узнать частоту использования того или иного словосочетания в статье.

Рис. 1. 18 фраз, которые чаще всего встречаются в статье «Коми-Пермяки.»

       AntConc

Это приложение помогает проанализировать статью или произведение и выявить там самые часто употребляемые слова.

Рис. 2. Самые популярные слова в статье про коми-пермяков.

Выше можно увидеть самый популярный предлог «В», который встречается 168 раз. Помимо предлогов, в AntConc также как и в Voyant tools изображаются слова «народ», «пермяк», «язык», «культура».  Опираясь на данные, которые показаны в скриншоте, можно понять, что в статье чаще говорится о культуре коми-пермяков.

Рис. 3. Данная функция помогает рассмотреть как распределены слова в текстах.

Можно сказать, что слово «пермяк» чаще всего встречается в начале и в конце статьи.

Рис. 4. Еще при помощи этого приложения также можно выявить словоформы, которые используются с важным ключевым словом.

В таком случае, у меня появились следующие словоформы. Приведу в пример прилагательные, используемые с важным ключевым словом: «Язвиньский пермяк», «Зюздинский пермяк», «Гайинский пермяк», «Коренной пермяк» и т.д. Из этого следует, что с помощью этого приложения можно узнать на какие виды подразделяются коми-пермяки.

Рис. 5. Самые частотные биграммы в статье «Коми-пермяки»

Самое часто встречающиеся слова это  «пермский» и «край».

Таким образом, делая итог по всему вышесказанному и описанному, можно сказать, что сделан текстовый анализ, по которому можно выявить самые часто употребляемые слова в статьях или же в произведениях и понять, что автор чаще всего использует в интерпретации своей речи.

Источники:

https://xn--74-6kcq7bhn4g.xn--p1ai/stati/narodyi/ko%CC%81mi-permyaki%CC%81.html

Сетевой анализ

Для того, чтобы выполнить данную лабораторную работу, был использован сайт Easy Linavis.

(В связи с некоторыми техническими трудностями, использовать Gephi не было возможности).

 


(рис. 7 Схема анализа анекдотов)
При создании схемы были использованы политические анекдоты разных лет (всего 18 штук). В результате работы получилась замкнутая схема, части которой скреплены друг с другом. Наибольшее количество ответвлений получилось у слова «Путин» (5), далее идёт «Лужков» (4), а третье место поделили два слова — «мэр» и «Горбачёв» (3). Все личности так или иначе связаны следующими маркерами: «мэр»«, «партия», «Москва» (неудивительно, ведь на схеме можно заметить фамилии двух мэров Москвы (Собянин и Лужков), каждая из личностей состояла/состоит в партии и все они проживали/проживают в Москве).


(рис. 8 Действующий Президент Российской Федерации В. В. Путин)

География политического анекдота России

В данной лабораторной работе был рассмотрен такой аспект политического анекдота, как его география.

Использованный сервис: Google Maps Engine.

К сожалению, на вышеуказанном сайте нельзя сделать карту с большим количеством отметок, поэтому пришлось разделись центры на две части:

Часть 1 — результат.
Часть 2 — результат.

Однако следует заметить, что центров получилось всего 17, вдобавок к этому имеются повторения по городам.

Виды центров:

  1. Университеты (РГГУ, СФУ, Cambridge University).
  2. Музеи (Эстонский Литературный Музей).

Также при составлении карты использовались интернет- и печатные издания разных годов.

Таймлайн

Для выполнения данной лабораторной работы был разработан таймлайн, на котором отмечены наиболее важные даты для развития политического анекдота и его дальнейшей популяризации среди частично советского и постсоветского обществ.

Используемый сервис — Sutori.

С выполненным таймлайном можно ознакомиться здесь.

В очередной раз была использована статья Михаила Алексеевского.


(рис.6 Политический анекдот, представленный в формате изображения)

Анализ текста

Цель лабораторной работы:
Анализ и визуализация текста про политический анекдот в России конца XX века.

Задачи:
1. Обработать текст, используя необходимые для этого ресурсы.
2. Описать полученные результаты.
3. Предоставить полученные результаты на проверку.

Использованные ресурсы:
1. AntConc
2. Voyant tools

Источник: М. Алексеевский «Анекдоты от Зюганова: фольклор в современной политической борьбе»

AntConc

После загрузки нужного текста в программу, был получен такой результат:


(рис.1 Результаты анализа текста в программе AntConc)

Игнорируя различного рода междометия, предлоги и союзы, можно выделить следующие наиболее часто используемые слова: «анекдот» (и его производные (62,52,27)), «лужков» (14), «фольклор» (7), «интернет» (6) (данные по последним трём словам из списка были указаны ниже, чем приведённые на рисунке примеры слов, следовательно, на нём [рисунке] результат не виден).

Далее можно рассмотреть в каких частях текста наиболее часто употребляется слово «анекдот»:


(рис.2 Наиболее частое употребление слова «анекдот»)

Ниже представлен результат такой операции, как Clusters/N-Grams для слова «лужков»:


(рис.3 Наиболее часто употребляемые пары со словом «лужков»)

Анализируя вышеуказанные результаты, можно выявить, что всё же наиболее часто употребляемым персонажем в политических анекдотах конца XX века в России был Ю. М. Лужков. И это неспроста: именно в период с 1992 года по 2010 год Юрий Михайлович был мэром Москвы. Более того, многие его действия осмеивались в постсоветском обществе (как раз таки посредством анекдотов).

 

 Voyant tools

(рис.4 Облако слов, созданное по результатам анализа текста в программе Voyant tools)


(рис.5 Схема связи между наиболее распространёнными словами)

 

Таким образом, можно сказать, что для анализа текста доступно большое количество программ, которые работают по-разному: например, создают облака слов (как Voyant Tools), или же ищут часто используемые слова (как AntConc). Однако это лишь малая часть доступных нам ресурсов.

Лабораторная работа №1

В данном проекте анализируется несколько первых глав художественного произведения «Охотница за скальпами» Эмилио Сальгари. Сам писатель — итальянец, но данная его книга из сборника описывает приключения некоренных жителей Америки XIX века, там огромное количество описаний из жизни на Диком Западе и борьбе с индейцами.

Для анализа произведений были использованы инструменты:

  1. Voyant tools
  2. Google books ngram viewer 
  3. Online utility text analyzer

VOYANT TOOLS

Инструмент позволяющий найти часто используемые слова, а также их точное число, выстраивая их в облако. Как видно из результатов, наиболее часто употребляемые слова:  джон(56); бизонов (39); тернер (37); бэд (28).  Как можно земетить очень часто используются имена героев книги — Джон и Бэд Тернер, так же слово «бизоны» — это в особенности характерно для одной из глав, одноименной этому слову.

Рис. 1  Облако слов романа

Здесь можно заметить как изменяется количество упоминаний популярных слов, например «бэд» и «тернер» значительно больше используются в главе «Бэд Тернер»

Рис.2 Тренды романа

GOOGLE BOOKS NGRAM VIEWER

Данный инструмент был использован для изучения интереса общественности  к роману. Удивительно, что в России роман пользовался большей популярностью, чем на родине автора.

Рис. 3 График использования словосочетания «Охотница за скальпами» в России

TEXT ANALYZER

И в конце мы решили провести анализ текста. Как вы можете заметить в тексте 10826 слов и 70529 знаков (включая пробелы).

 

Лабораторная работа №3

История коренных народов США всегда интересовала большое количество людей по всему миру, однако немногие знают где именно на территории СШа жили эти народы и в каких местах им приходилось сталкиваться с трудностями, например, переживать войны. для этого мы решили рассмотреть подробнее множество мест, где жили эти народа, создав интерактивную карту.

Для создания интерактивной карты мы решили использовать сервис Google Maps Engine, так как он показался наиболее удобным в создании карт, и в нем можно применять свои стили к отметкам.

Ознакомиться с интерактивной картой полностью можно по этой ссылке

В целом, в результате создания карты, мы пришли к основному выводу: в крайне редких случаях индейцы жили по одному племени в пределах одного штата( тогда, вероятно, территории), во многих случаях они наоборот жили более сгруппировано, а не разбросано. Так же можно заметить, что войны велись, в основном, наиболее крумными и развитыми племенами.

Анализ диссертации на тему Этнополитические процессы в Чечено-Ингушской АССР в 1957–1990 гг.: последствия депортации и основные аспекты реабилитации чеченцев и ингушей

Для анализа была взята диссертация на соискание  ученой степени кандидата исторических наук. Основная тема-особенности советской этнополитики в Чечено-ингушской АССР. https://www.elibrary.ru/item.asp?id=30302134

Наиболее употребляемыми словами ожидаемо стали слова ‘чеченцы» «ингуши» и производные от них. Также стоит обратить внимание на 1957 год- дата реабилитации вайнахского народа.

 

 

  Читая данную работу я выдвинул гипотезу о том, что автор, говоря об этнополитических процессах в Чечне, крайне мало уделяет внимания русским-донной из крупнейших этнических групп, проживавших в республике.Это подтверждается ниже на примере сравнения упоминаемости русских и ингушей :

  

Также отметим, что упоминаются русские в основном только во введении

Также обратим внимание на связки: здесь кроме уже привычных «грозненский» «чиасср» и «грозненский» мы встречаем слово «рабочий». Это связано с частыми упоминаниями о формировании чеченсского рабочего класса.

В заключение обратим внимание на лексическую плотность текста, она составляет 0.219

Наиболее употребляемые слова:; ингушей (400); чеченцев (374); чечено (297); чиасср (259)