Анализ текста

Фото: Виктор Лягушкин

В данной лабораторной работе я планирую проанализировать, что писалось об Ординской пещере как в научно-популярной литературе, так и на различных сайтах, посвященных ее изучению. Анализ будет проходить с помощью таких инструментов, как Voyant Tools, Google Trends и AntConc. Для работы с данными программами и серверами был использован лемматизированный текст, который можно получить в онлайн лематизаторе либо в лематизаторе для переработки текста.

Корпус конечного варианта текста был составлен из следующих:
1) Интернет ресурсы: https://uraloved.ru/ordinskaya-peshera; https://wikiway.com/russia/ordinskaya-peshchera/
2) Литература:Максимович Н. Г., Максимович Е. Г., Лавров И. А. Ординская пещера. Длиннейшая подводная пещера России. – Пермь, 2006. 64 с; Илл. 96

Voyant Tools
Данный сервер позволяет создавать красивые визуализации исходного корпуса, чтобы с ее помощью можно было, не читая сам текст, узнать о его содержании быстро и, при этом, поймать эстетическое наслаждение.

На этой замкнутой системе можно проследить связь слов в тексте, проследить словосочетания и понять общий смысл, не читая весь текст, а в бегущей внизу строке проследить закономерность связей. Самыми популярными словами являются «пещера», «вода», «порода», «ход», «год»,»часть», «зал». Данные слова не только связывают смысловую нагрузку текста, но еще и являются самыми употребляемыми. Вы можете сами изучить интерактивность схемы с помощью курсора мышки. Действительно, изученные тексты повествуют в большей степени о морфологии пещеры, то есть об ее внутреннем убранстве, о ходах, и о том, каким образом образовалась эта пещера. Карстовые породы, образовавшиеся здесь много миллионов лет назад, со временем разрушались под действием внешних факторов и вымывались, образовывая подземные ходы, а затем и целые пещеры. Длина сухопутного хода составляет 300 м, а длина подводной части — 4600 м. Сложность погружения в пещеру связана с тупиками в некоторых частях пещеры, узкими проходами и отсутствия возможности развернуться, замерзанием озер в холодное время года и невозможностью подняться на поверхность с воздухом в некоторых гротах.

Google Trends
На этом сервере можно отследить частоту запросов в Google о каком-либо феномене, просмотреть графики популярности, сравнить с другими словами, а так же отследить запросы из других регионов и стран.
 Карта Google Trends — запросы об «Ординской пещеры» в разных точках мира (на русском языке).

Данная схема показывает, в каких странах мира, кроме России, известна пещера. Можно предположить, что график распространения связан с историей изучения самой пещеры и визитами в нее дайверов из других регионов России и иных стран.
Российские исследования пещеры начались с 1992 года. Изначально это было частной инициативой, а затем перешло под государственное руководство. В 2000-е года пещеру посещали исследователи из США, Великобритании, а в 2017 году японская телекомпания сняла научно-популярный фильм о погружении в Ординской пещере. Подробнее об истории изучения пещеры можно узнать в разделе Лабораторная работа №2.

Voyant tools
Продолжим работу с данным сервером.
Визуализация основных тем в повествовании об Ординской пещере. Слова «карст» и «почва» играют немалую роль как и в представленном «облаке слов», так и в самой истории природного памятника, потому что именно особенности рельефа создали одну из самых сложных подводных пещер мира.
Первым условием развития карста является наличие на данном участке земной коры растворимых пород: карбонатных, сульфатных, соляных. Эти породы слагают почти третью часть суши. Наиболее распространенными среди них являются карбонатные породы: известняки, состоящие преимущественно из минерала кальцита. Второе условие развития карста – наличие в породе трещин и, в меньшей степени, пор. Атмосферные осадки и поверхностные воды по трещинам проникают в породу и движутся в ней. Все породы обладают трещиноватостью, но количество, или густота, трещин, с глубиной уменьшается, и порода становится менее проницаемой для воды. Третье условие возникновения карста – наличие воды, которая чаще всего имеет атмосферное происхождение. Дождевые воды, а также талые снеговые воды поглощаются трещинами и движутся в толще пород вниз под действием силы тяжести. С глубиной трещиноватость уменьшается, и вода накапливается на менее проницаемых породах в виде карстового водоносного горизонта. Вода постоянно движется в толще пород. Карстовые воды выходят на поверхность в виде родников или питают реки, озера, моря. И, наконец, четвертое условие развития карста – способность воды растворять породу. При движении в трещинах и полостях вода насыщается солями, и часть растворенных в ней соединений может отлагаться в виде вторичных минералов. Только при наличии всех перечисленных условий возможно образование карстовых форм. В нашем случае, именно так появилась Ординская пещера.

Ant Conc
Программа позволяет анализировать корпус по часто встречающимся словам, по словосочетаниям, ключевым словам. сравнивать с другими корпусами, что очень удобно для анализов больших объемов текста. Программа бесплатна и понятна в использовании. Благодаря ей можно найти ключевые слова текста ,самые популярные слова, провести анализ по частоте использования или наоборот отсутствия использования с другими текстами. Для работы с данной программой подойдет старая версия,  т.к. она содержит в себе более четкий интерфейс и не имеет технических сбоев, к примеру, с кадировкой лематизированного текста.

На данном скриншоте видны часто употребляющиеся ключевые слова текста. Помимо предлогов самыми распространенными словами являются «пещера», «ход», «вода», «порода», «зал», «вход». Данные слова играют наибольшее значение в анализе корпуса, а так же составляют основу описания самой пещеры. Взглянув на данную схему, можно понять, что в корпусе идет речь о неком природном памятнике — подводной пещере, об озерах в нем, гротах и залах, их метраже и составе породы самой пещеры.