Анализ и визуализация текста ФЗ «Об охране атмосферного воздуха»

Анализ и визуализация текста ФЗ «Об охране атмосферного воздуха».

Данная часть проекта представляет собой анализ и визуализацию, с помощью специальных сервисов, Федерального закона «Об охране атмосферного воздуха» Российской Федерации. Как правило, законодатель при создании законов, формирует и интерпретирует свою мысль ёмко и точно. Помимо этого, законодатель формулирует тексты закона юридическим языком. В связи с этим, мы не считаем необходимым анализировать смысловую составляющую текста. В рамках данного исследования мы можем посмотреть на текст указанного закона с лингвистической стороны.

Оригинал текста можно найти здесь.

Для проведения анализа и визуализации статьи были выбраны следующие ресурсы:

  1. WordItOut
  2. Online-Utility.org
  3. tools4noobs.com
  4. Google Books Ngram ViewerПрежде всего, мы составили облако слов, с помощью сервиса WordItOut, который анализирует текст и находит наиболее часто используемые слова (Рис.1).  В нашем случае, наиболее употребляемыми словами являются «атмосферного», «воздуха», «Российской», «ФЗ». Как мы можем заметить, в облаке почти не всплывают предлоги и иные части речи, которые не несут смысловой нагрузки. Подобный результат еще раз подтверждает то, что законодатель грамотно и лаконично составляет текст закона.


(Рис.1)
Сервис www.tools4noobs.com также как и предыдущий, позволяет выявить наиболее употребляемые в тексте слова. Однако его особенность заключается в том, что он способен подсчитать точное количество использования наиболее употребляемых слов. Мы можем увидеть следующий результат (Рис.2):

(Рис.2)

Помимо этого, отличительной особенность данного сервиса является способность генерировать несколько предложений, отражающих  суть текста (Рис. 3). Читатель может просмотреть сжатые предложения и уловить смысл статьи.

(Рис.3)

Online-Utility.org, в отличие от предыдущих сервисов, позволяет найти не только самые популярные слова в тексте, но и фразы. Помимо этого, сам сайт является англоязычным, однако там возможен анализ текстов на других языках. Кроме того, данный сервис: подсчитывает количество слов, знаков, предложений, слогов, а также лексическую плотность.
В нашем случае:
Количество символов (включая пробелы): 61055

Количество символов (без пробелов): 51766

Количество слов: 7539

Лексическая плотность: 17.4824

Количество предложений: 586

Количество слогов: 7543

(Рис.4)

Что касается самых популярных фраз используемых в законе, то их вы можете увидеть на (Рис.5):

(Рис.5)

Мы можем заметить, что наиболее популярной фразой является «выбросов вредных загрязняющих веществ в атмосферный воздух», данная фраза в тексте закона используется 13 раз. Подобный результат показывает нам, что законодатель составляя данный закон действительно акцентирует внимание на проблему, которая явилась причиной  правотворчества (создания закона).

Таким образом, все используемые ресурсы отличаются друг от друга и имею свои особенности. С помощью подобных сервисов мы можем посмотреть на интересующий нас текст с разных сторон, что позволит наиболее глубоко погрузиться в исследуемую нами область.

Последним используемым сервисом является Google Books Ngram Viewer. Данный сервис позволяет строить графики частотности языковых единиц на основе огромного количества печатных источников (Рис.6), опубликованных с 16 века и собранных в сервис Google Books.
В нашем случае, мы ввели «охрана атмосферного воздуха» и получили следующие данные:

(Рис.6)
Получившийся результат, дает нам увидеть, что проблема охраны атмосферного воздуха начала оглашаться в печатных изданиях после 1920 года. Мы можем предположить, что это было вызвано новой экономической политикой (НЭП) и дальнейшим производственным и промышленным процветанием России. Это говорит о том, что общество осознавало, что производственные и промышленные выбросы веществ в атмосферу отрицательно влияют на воздух, который, в связи с этим нуждается в охране. В дальнейшем, рост использования данных слов в печатных изданиях заметен в период после окончания Второй Мировой войны. Мы можем предположить, что это связано с тем, что в военное время было использовано большое количество оружия, которое наносило урон окружающей среде, в том числе и атмосфере.
Особый всплеск использования данного предложения в печатных изданиях заметен на период с 1970 по 1998 годы. Возможно, подобного рода интерес в охране атмосферного воздуха был вызван холодной войной и растущим темпом индустриализации страны.

Следующая страница 
Вернуться назад