Введение в DH. 30.04.2020

План работы:

  • Представление студенческих работ по анализу текста
  • Что такое корпусная лингвистика? Какие виды корпусов вы знаете? Необходимо привести конкретные примеры
    • Задания на Образовательном портале Национального корпуса русского языка
    • Google Books Ngram Viewer (Google Ngram Viewer)
      Поиск исторических событий, их отражения в корпусе по вашей теме исследований
  • Google Trends, Подбор слов Яндекс
  • Что такое TEI и XML? Почему гуманитариям важно знать и уметь использовать TEI-XML?

Читать далее

One Man to Rule Them All — анализ творческого наследия Дж. Р.Р. Толкина

Абстрактное Толкинистское исследование

 

«Спору нет, если ищешь, то всегда что-нибудь найдешь, но совсем не обязательно то, что искал.»
Джон Роналд Руэл Толкин

Безусловно, самым известным и популярным произведением Толкина был и остаётся роман Властелин Колец. Но немалой долей своей притягательности и успеха он обязан глубине и эпическом размаху, который придают ему многочисленные легенды и предания, рассказанные или едва упомянутые в романе. В этом смысле сюжет и события, описанные во Властелине Колец уместно сравнивать с древесным листом — самым прекрасным, но всё же одним из многих, выросших на дереве. Как читатели Хоббита догадались, что на дереве должны быть и другие листья, так и читатели Властелина Колец  почувствовали, что и за этим романом стоит нечто большее.

Данное исследование направлено на то, чтобы доказать, что это самое «большее» не просто существует, а напрямую прослеживается во всех трудах профессора Толкина. В качестве наиболее показательного примера будет использовано наиболее объёмное произведение автора — Властелин Колец, анализ текста которого будет представлен ниже.

Источник: The Lord of The Rings (в 3х книгах: The Fellowship of The Ring; The Two Towers; The Return of the King) в формате txt.

Используемые ресурсы:

  • корпусный анализ текстов voyant-tools.org
  • корпусный анализ текстов AntConc
  • национальный корпус русского языка — http://ruscorpora.ru/
  • облако слов — wordart.com
  • текст-майнинг — sketchengine.eu
  • Google Books Ngram Viewer — books.google.com/ngrams
  • Google Trend — trends.google.com

 

Общий анализ культурного наследия

Толкин работал над созданием собственного мира на протяжении многих лет и результатом этих многолетних трудов стало запечатление его имени в истории.  Однако слава пришла к ему далеко не сразу. Следует проследить путь славы профессора Толкина.

Данные предоставлены сервисом анализа книг Google Books.

Динамика употребления имени Толкина в англоязычных источниках представлена на рисунке 1.

Рисунок 1 — Динамика изменения упоминаний Дж. Р.Р. Толкина в англоязычной литературе

  1. Мы можем наблюдать, что первые упоминания имени Толкина в литературе относятся примерно к 1937 году. Именно тогда в свет вышло его первое произведение Хоббит.
  2. Постепенно набирая популярность, имя Толкина всё чаще встречается в книжных изданиях. Новый подъём приходится примерно на 1947 год, когда публикуется первая часть романа Властелин Колец — Братство Кольца. Начиная с этого момента, динамика употребления его имени стремительно растёт.
  3. Период роста продолжается до выхода в печать неоконченного труда Толкина под названием Сильмариллион в 1977 году. Достигнув пика славы, имя профессора постепенно теряет свою популярность.
  4. Небольшую волну интереса к автору вызывает серия публикаций неоконченных работ в цикле книг  из 12 томов под названием История Средиземья.
  5. Начиная со второй половины 90х годов имя Толкина всё чаще и чаще встречается в литературе. Апофеоза его популярность достигает в начале 2000х годов. Огромное влияние на это оказала кинотрилогия Питера Джексона.

Данные позволяют нам понять, какие точки в биографии Толкина были основополагающими в становлении его наследия мировым:

  • публикация повести Хоббит,
  • романа Властелин Колец,
  • книги Сильмариллион,
  • выход фильмов П. Джексона.

Причём каждое произведение подогревало интерес к последующему, что можно видеть из данных графика. Толкин, работая над вселенной в целом, тем не менее придерживался строгой последовательности публикации своих произведений, чтобы дать читателю возможность постепенно окунуться в волшебный мир Средиземья.
Несмотря на большие ожидания, возлагаемые на Сильмариллион, можно видеть, что его публикация негативно повлияла на интерес к личности Толкина. Это можно объяснить тем фактом, что стилистически и содержательно данное произведение сильно отличалось от того, что было представлено читателю в романе Властелин Колец и повести Хоббит.
Значительный спад продолжался до тех пор, пока до массового зрителя не дошёл фильм Питера Джексона, который вновь осветил имя великого отца жанра фэнтези.

 

Картина справедлива для мировой практики. Однако в условиях русских реалий данные несколько отличаются.

Посмотрим на картину употребления имени Дж. Толкина в корпусе русскоязычных текстов, представленных на рисунке 2.
Для более точного анализа были взяты данные из 2х независимых друг от друга сервисов: Google Books Ngram Viewer и Национального корпуса русского языка.

Рисунок 2 — Динамика изменения упоминаний Дж. Р.Р. Толкина в корпусе русских текстов

Мы видим, что данные примерно одинаковы, но сервис Google Books охватывает чуть большее количество источников.

Интерес  к личности Толкина в русскоязычном сообществе появился лишь незначительный. Небольшой всплеск приходится приблизительно на 1937 год, когда была опубликована книга Хоббит. Однако большого интереса на территории СССР до 1980 года личность Дж. Толкина так и не вызвала.

Данный феномен можно объяснить политическим режимом, действующим в эти годы в Советском союзе. Лишь с началом ослабления давления на культуру со стороны партии художественная литература стран Запада начала переводиться на русский язык.
С этого момента произошёл резкий скачок вверх, который обернулся падением лишь после 2003 года, уже после выхода фильмов П. Джексона.

 

Похожую картину демонстрирует также график употребляемости в литературе основных произведений профессора: Хоббит, Властелин Колец и Сильмариллион.

Рисунок 3 отображает степень заинтересованности различными книгами Толкина во всём мире и в России. В русскоязычном сегменте интерес к трудам Толкина возник лишь с ослаблением Советского Союза, что также связано с политическим режимом.

Рисунок 3 — Динамика изменения употребления основных трудов Дж. Р.Р. Толкина

Примечательно, что по сравнению с мировой практикой, популярность Хоббита в России долгое время находилась на более высоком уровне, чем у Властелина Колец. Последнее смогло обогнать «детскую книжку» лишь после выхода уже упомянутых выше фильмов Питера Джексона в 2001 году.

 

Интересную динамику демонстрирует также степень употребления основных персонажей вселенной Толкина.

Рисунок 4 — Динамика употребления имён основных персонажей книг Дж. Р. Р. Толкина

На протяжении большей части периода Бильбо Бэггинс является наиболее употребляемым в литературе персонажем, как в англоязычных, так и в русскоязычных работах.

Таким образом, Бильбо, как первооткрыватель всей вселенной Толкина, сохранял за собой первенство среди «любимцев» мировой публики вплоть до выхода кинофильмов в 2001 году.  Это вполне можно объяснить тем фактом, что именно с него начинается история Кольца, и именно он является проводником читателя в волшебный мир, созданный Толкиным.

В русском языке данный персонаж получил свою долю внимания гораздо позднее. После выхода в свет книги Хоббит упоминания о нём встречаются в период с 1942 по 1960 гг., однако затем интерес вновь спадает.
Новый виток развития данная личность получает после распада СССР и выхода свет многочисленных переводов книг Толкина.
По сравнению с мировой практикой, образ Бильбо после выхода фильмов в 2001 г. не утратил своей популярности, а наоборот, обогнал Фродо. Возможно, в данном случае сыграл фактор того, что российская аудитория с довольно большим запозданием ознакомилась с миром Средиземья в целом.
В данном случае стоит рассматривать работы русскоязычных авторов по вселенной Хоббита и Властелина Колец как периферийный дериват, появившийся намного в более поздние годы, чем это произошло на Западе.

 

 Анализ поисковых запросов

Корпуса книг не позволяют в полной мере проследить интерес аудитории к тому или иному явлению ввиду их хронологической ограниченности (Google Books обрабатывает книги до 2012 г. включительно) и акценту исключительно на литературные источники.
В современных реалиях стоит учитывать такой мощный пласт информации как интернет-запросы. Для их анализа используется поисковый сервис Google Trend.

Анализ запроса «Дж. Р.Р. Толкин» (писатель)

Мы можем наблюдать, что наибольший интерес к личности профессора Толкина приходится на январь 2004 года. Это совпадает с периодом начала отсчёта статистики веб-поиска.

  1. Пик интереса приходится на январь 2004 года, когда были объявлены номинанты 76ой церемонии вручения премии Оскар, среди которых был уже нашумевший на тот момент фильм Властелин Колец — Возвращение короля. Последующий интерес можно объяснить тем, что 29 февраля 2004 фильм с громким успехом завоевал 11 наград.
  2. После этого наблюдался некоторый спад, продолжающийся до 2007 года.  Небольшой пик популярности объясняется тем, что в 2007 году сыном Джона Толкина, Кристофером, была дописана до полноценной книги легенда Дети Хурина.
  3. Следующие пики популярности последовательны и приходятся на декабрь 2012, 2013 и 2014 годов. На этот период приходится выход в свет фильмов Питера Джексона по мотивам произведения Хоббит.
  4. Новым событием, сыгравшим роль в увеличении интереса к его личности стала премьера биографического фильма Толкин в мае 2019 года.
  5. Последним известным событием, которое привлекло внимание к профессору Толкину и его наследию стала смерть его младшего сына Кристофера в январе 2020 года, который играл большую роль в расширении вселенной своего отца.

Весьма похожую картину мы можем наблюдать на графике популярности запросов основных произведений Толкина.

Анализ запроса книг Властелин колец, Хоббит, Сильмариллион

Запросы по книгам демонстрируют параллельное имени самого Толкина движение. Повышенный интерес к роману Властелин Колец на первой половине периода вновь объясняется оглушительным успехом кинотрилогии.
Однако заметно, что, познакомившись с миром через фильмы и прочитав книгу, аудитория начала активно знакомиться и с другими работами писателя.
Причём после 2012 года каждая из трёх книг вызывает интерес неотрывно друг от друга, что говорит нам о тесной взаимосвязи каждой из них между собой и с личностью автора в целом.

Мы можем наблюдать большое влияние, которое оказали фильмы Питера Джексона на популяризацию творчество Толкина. Возникает рациональный вопрос — не затмил ли режиссёр личность создателя вселенной Властелина Колец?

Анализ запросов Питер Джексон и Джон Толкин

Несмотря на широкую популярность у массового зрителя именно фильмов, имя Дж. Толкина на протяжении всего периода с 2004 по 2020 гг. вызывало больший интерес, чем имя режиссёра П. Джексона.
Обогнать писателя ему удалось лишь в 2005 году, однако этот успех не связан со вселенной Властелина колец. В 2005 году состоялась премьера фильма Кинг-Конг, который вызвал повышенное внимание к Питеру Джексону.

Своим безумным успехом профессор Толкин обязан далеко не одним Властелином колец, однако данная книга, как наиболее показательный труд автора, станет отправной точкой в исследовании содержания произведений.

Анализ содержания произведения Властелин Колец

 

Лингвистические структуры всегда действовали на меня, как музыка или цвет.
Дж. Р.Р. Толкин

 

Профессор Толкин уделял языковому аспекту своих произведений огромное значение, именно поэтому при разборе текстов его произведения можно извлечь большое количество содержательной (и не очень) информации о мире Средиземья в целом.

Начать стоит с общей характеристики романа.

Ниже представлены данные, полученные в результате обработки корпуса текстов сервисом Voyant Tools.

Корпус текстов включает в себя 3 книги на английском языке :

  • Братство Кольца
  • Две башни
  • Возвращение короля

Количество слов в трёх текстах составляет 479 645, включая 13 264 уникальных формо-слов.

Рисунок 5 — Совокупные данные по длине слов и объёму предложений по трём книгам

Первая книга — самая длинная по своему содержанию, что весьма характерно для открывающего всё повествование фрагмента общей картины.
Самой короткой же является последняя часть трилогии.

При этом довольно любопытными деталями является то, что как по плотности словарного запаса, так и по среднему количеству слов в предложении именно , самая маленькая книга, занимает лидирующее положение.
Это указывает на то, что по содержанию контента именно данная часть произведения является наиболее глубокой по смысловой нагрузке. Толкин строит своё повествование постепенно, начиная с простого и плавно продвигаясь к финалу.

Согласно анализу всего корпуса, наиболее употребляемыми словами являются следующие:

Most frequent words in the corpus: said (4110); frodo (1864); came (1256); sam (1231); great (1195)

Наиболее наглядное представление об основных словах даёт облако слов, сформированное на основе корпуса текстов:

Большой частотой употребления обладают глаголы действия, такие как said, come, know, went. Это свидетельствует о том, что большая часть событий в повествовании строится вокруг активных действий и взаимодействии между персонажами, в результате которого им приходится много разговаривать.
Это характерная форма повествования для произведения, завязанного на путешествии главных героев с какой-либо важной миссией.

Явно выделяются на общем фоне употребления рас персонажей.

Примечательным является выделение на фоне всех остальных рас Средиземья двух основополагающих — men, hobbits т.е. людей и хоббитов. Не просто так именно они являются наиболее употребляемыми во всём тексте. Эти две расы сыграли решающую роль в Великой Войне.

Какие расы упоминаются в тексте наиболее часто, можно увидеть из следующего графика:

  1. Наибольшего числа упоминаний заслуживают хоббиты. Именно они, меньшие и слабейшие из всех, оказались той силой, которая смогла побороть великое зло. Именно поэтому Толкин и отводит им особое место в своих текстах.
  2. Следующими по употребляемости являются эльфы — любимая раса Дж. Толкина. Они — древнейшие и мудрейшие существа, которые направляют героев на протяжении большей части повествования.
  3. Практически наравне с эльфами используется термин люди (man). Вокруг них вертится множество событий и именно им отводится роль главного борца с войсками Тёмного Властелина.
  4. Роль гномов в истории совсем мала, что также отражается и в языковых средствах. Их народ не участвует в Великой войне и слишком занят собственным обогащением. Единственным представителем этой расы является Гимли, один из главных героев. Однако даже один-единственный персонаж смог вызвать в тексте большое количество упоминаний, что указывает на то, как важна его роль для общей миссии.
  5. Орки составляют самую огромную по численности орду, вражеские силы, которые хотят уничтожить всё живое. Тем не менее, с языковой точки зрения Толкин не отводит им большого внимания, как бы указывая на их незначительность по сравнению с силами добра.
Облако слов также помогает нам вычислить наиболее употребляемые имена персонажей: Фродо и Сэм, Гэндальф, Арагорн, Мэрри и Пиппин.

Им отводится особое место в произведении, согласно сюжету, каждый из них имеет своё особое предназначение и свою роль в победе над врагом.

На графике, приведённом ниже, представлена динамика употребления имён основных персонажей в тексте произведения:

Несмотря на то, что как персонаж Бильбо появляется в тексте произведения лишь на короткий промежуток времени, мы можем наблюдать, что имя его встречается в тексте наравне с активными участниками событий всех трёх книг. Это указывает на роль персонажа в общей картине мира и отсылает нас к тому, что именно с Бильбо началась история Кольца.

То же самое мы можем наблюдать на сравнительном графике участия персонажей в повествовании, созданным инструментом Stream Graph в Voyant Tools.
Хотя Бильбо Бэггинс и не является участником событий всех книг, след его влияния прослеживается на всём пути движения Фродо к своей цели.

из voyant

Из графика видно, что можно вычленить 3 пары персонажей, которые появляются в тексте неотделимо друг от друга: Гимли и Леголас, Мерри и Пиппин, Сэм и Фродо.
Гимли и Леголас

Гимли и Леголас являются персонажами, которые тесно взаимодействуют между собой, постепенно выстраивая дружеские отношения. График демонстрирует примерно равное количество упоминаний их обоих в одних и тех же частях произведения, доказывая связь между ними.

Рисунок 5 — Частота употребления в тексте Гимли и Леголаса

Пиппин и Мерри

Следующей парой персонажей, взаимосвязь которых видна на графике, являются Мерри и Пиппин. Эти два Хоббита с детства неотрывно следуют друг за другом. Их связь очень прочна, что подтверждается с языковой точки зрения, параллельно развивающимся шаблоном их упоминаний.

Рисунок 6 — Частота употребления в тексте Мерри и Пиппина

Фродо и Сэм

Несколько иной шаблон развития можно наблюдать, наблюдая за парой Фродо/Сэм. Эти двое, начиная с первых этапом путешествия, были вместе. Сэм неотрывно следовал за «мистером Фродо» куда бы тот ни пошёл, однако по-началу роль его была незначительной.
По мере развития сюжета, мы видим, как крепнет место в событиях повествования. Чем слабее под влиянием кольца становится Фродо, тем большее значение в этом путешествии начинает играть Сэм, который всячески поддерживает своего друга.
Апофеозом развития этих отношений становится преобладание роли Сэма и его активная роль в победе над врагом.

Рисунок 7 — Частота употребления в тексте Фродо и Сэма

Как проследить глубину повествования употреблению тех или иных слов.

Ещё одной парой слов, которые явно выделяются на фоне остальных в облаке слов являются dark и light. Несмотря на то, что они являются антонимами, оба этих слова являются одними из наиболее встречаемых в текстовом корпусе.

Ниже представлена динамика их употребления в зависимости от книги, полученная с помощью программного анализа AntConc:

Рисунок 8 — Динамика употребления слов light и
dark

Оба слова, являясь противоречивыми, идут на протяжении всего повествования рука об руку. В этом особенность подхода Джона Толкина к восприятию мира: нет чего-то однозначно хорошего или плохого, свет и тьма в этом мире, как и во всех других, находятся в равновесии.

Ни одно слово в произведениях Толкина не употреблено без какой-либо цели, каждое имеет своё предназначение и несёт в себе определённый смысл.

Таким образом, на основании статистических данных и корпуса текстов основного произведения Дж. Р. Р. Толкина было рассмотрено творческое наследие создателя целой вселенной, породившей на свет многие современные фэнтези произведения. Прошедшее проверку временем, оно и по сей день сохраняет культовый характер и является источником вдохновения для многих людей по всему миру.
Всем этим величием произведения Толкина обязаны богатству языка и невероятной степени использования художественных средств для построения картины мира и повествования в целом.

Кукольное облако

Визуальный анализ статьи о шарнирных куклах, представленный в виде облака слов. Даёт представление о примерном содержании статьи.
<!— Exported from Voyant Tools (voyant-tools.org).

Соловьева А. С. Заговор Килона-предпосылка первых законов Афин //Гуманитарный научный вестник. – 2017. – №. 7. – С. 54-59.

Анализ употребляемых слов текста статьи Соловьевой А. С. Заговор Килона-предпосылка первых законов Афин //Гуманитарный научный вестник. – 2017. – №. 7. – С. 54-59.
Вот, что получилось:

Крис Ханн ECONOMIC ANTHROPOLOGY

Анализ статьи Криса Ханна «Economic Anthropology» in: The International Encyclopedia of Anthropology online

Анализ связей позволил увидеть одну из особенностей данного текста и сделать вывод о том, что в нем часто происходит перенос строк, т.к. в тексте нет самостоятельных слов ogy и nthropol, но они отмечены в схеме как значимые элементы. Помимо того, упоминания о Кембридже свидетельствуют о том, что большая часть исследований и работ по экономической антропологии была проделана именно там.