Лабораторная работа №1. Шекспировский вопрос

Для начала принято решение провести собственное небольшое исследование по шекспировскому вопросу. В качестве текстов для сравнения выбраны пьеса «Гамлет» Уильяма Шекспира и «Испанская трагедия» Томаса Кида. Текст «Гамлета» взят из корпуса текстов Уильяма Шекспира на сайте Dracor.org, его объём составляет 29 700 слов. Текст «Испанской трагедии» взят с сайта www.gutenberg.ru и насчитывает 22 400 слов.  Выбор обусловлен тем, что именно Томаса Кида считают одним из претендентов на авторство шекспировских текстов, по крайне мере ранних. Не исключается, что именно он написал «Гамлета». Более того, именно Томас Кид может быть и автором так называемой «Ur-Hamlet»- пьесы, лежащей в основе шекспировского шедевра. При помощи программы Voyant Tools была выявлена наиболее часто встречающаяся лексика:

55 наиболее встречаемых слов в «Гамлете» Уильяма Шекспира.

 

55 наиболее встречаемых слов в «Испанской трагедии» Томаса Кида.

Как видно, различия достаточно существенные. Однако ещё более говорящие результаты даёт сравнение частотности использования определённой лексики в пьесах:

Сравнение частоты использования 5 самых распространённых слов в обоих текстах.

Сравнение частоты использования других слов, в том числе крайне важных для сюжета произведения (revenge, good,father,son, heaven,prince).

Хорошо заметно, что частота употребления этих слов в обоих пьесах довольно сильно рознится.

Помимо частоты употребления определённой лексики важнейшую роль также играют такие показатели, как частотность вокабуляра, среднее количество слов на предложение и индекс читабельности:

Если частотность вокабуляра и количество слов на предложение различаются незначительно, то индекс читабельности показывает заметные различия. Возможно, это связано со стилем каждого текста, его лексических, грамматических и синтаксических особенностей.

Из этих данных можно сделать следующий вывод: мы не можем утверждать наверняка, что автор «Испанской трагедии» является также и автором «Гамлета», однако никаких оснований считать, что их написал один и тот же человек нет. Схожая лексика,безусловно, присутствует, однако частота её употребления заметно рознится. Более того, та лексика, которая играет огромную роль в сюжете «Гамлета» (revenge,father,son,good,heaven,prince)  употребляется в пьесе с уникальной частотой, сильно отличающейся от употребления этой лексики в «Испанской трагедии».

Помимо этого исследования, принято решение воспользоваться сервисом Google Ngram Viewer для поиска частоты употребления словосочетания «Shakespeare authorship». Это важная часть проекта, так как он посвящён и истории шекспировского вопроса.

Самая интересная часть этого графика — резкий скачок популярности словосочетания в 2000-ых годах. Возможно, это связано с  популяризацией шекспировского вопроса в интернете и массах (интернет-«Декларация разумного сомнения относительно личности Уильяма Шекспира», публикация «The New York Times» результатов опроса шекспироведов относительно шекспировского вопроса, премьера художественного фильма «Аноним», транслировавшего оксфордианскую гипотезу, публикация стилометрических исследований работ Уильяма Шекспира и т.д.).