Используемые ресурсы:
- корпусный анализ текстов voyant-tools.org
- корпусный анализ текстов AntConc
- лемматизатор текста https://iksweb.ru/tools/lemma/
Используемые тексты:
- статья Гаврилова С. Т., Белоусова И. В., Покаместова А. В. «История становления организованной преступности в России», опубликованная в журнале «Территория науки» в 2015 году и содержащая около 15.000 слов. URL: https://cyberleninka.ru/article/n/istoriya-stanovleniya-organizovannoy-prestupnosti-v-rossii/viewer
- Интернет-статья «Организованная преступность: понятие, формы проявления, основные характеристики», содержащая около 19.000 слов. URL: https://studopedia.ru/10_201989_organizovannaya-prestupnost-ponyatie-formi-proyavleniya-osnovnie-harakteristiki.html
ANTCONC
AntConc — программа для выполнения исследований по корпусной лингвистике, которая стала первой, которую я использовала в своем проекте.
В ходе выполнения корпусного анализа двух используемых мной текстов было выяснено, что наиболее часто используемыми словами стали «преступность» и «организованная». Это является очевидным результатом, поэтому предлагаю отбросить эти два слова и все возможные их формы и обратить внимание на слово «структура», которое, как мне кажется, может подтвердить, что ОПГ — это именно структура, имеющая четкую собственную иерархию (в отличие от неорганизованной преступности). Для работы были загружены сами тексты, затем проанализированы Word List и Keyword List с помощью отдельно загруженного файла «reference», который помог исключить предлоги и местоимения и оставить более важные слова.
VOYANT TOOLS
Voyant Tools — инструмент для визуализации анализа текста, с помощью которого были обнаружены 25 наиболее повторяющихся слов в используемых материалах и более 2.237 уникальных словообразований.
Most frequent words in the corpus: организованной (24); преступных (15); россии (15); законе (14)
ЛЕММАТИЗАТОР ТЕКСТА
Лемматизатор текста и проверка N-грамм в тексте — следующий инструмент, использованный в проекте. С его помощью после загрузки текстов были выявлены топ-10 повторяющихся слов. «Закон» в данном тексте непосредственно связан с организованной преступностью, потому что очевиден тот факт, что ничего законного здесь быть не может, если следующим словом идет «преступление».
Таким образом, были проанализированы корпусы текстов с помощью трёх различных инструментов. В ходе работы сложилось четкое понимание самого феномена организованной преступности и, главное, чем оно отличается от неорганизованной. Ответ скрывается в самом вопросе: организацией. В отличие от чёткого, заранее спланированного организованного преступления, неорганизованное можно назвать анархией. Кроме того, организованная преступность часто покрывается вышестоящими людьми: политиками и бизнесменами, которых члены ОПГ, что называется, «крышуют».
Использованные тексты нельзя назвать только историческими или только юридическими, поскольку имеют информацию и о самом феномене организованной преступности, и о структуре группировок, и о тех наказаниях, которые предусмотрены для участников группировок.