Дистрибутивно-статистический анализ языка русской прозы 1850-1870-х гг. Том 3

ISBN
978-5-907290-61-7
Количество страниц
768 с.
Рубрики
прикладная лингвистика
корпусная лингвистика
язык художественного текста
Год издания
2021

Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Дистрибутивно-статистический анализ языка русской прозы 1850-1870-х гг. Том 3. М.: Издательский дом ЯСК, 2021 — 768 с. ISBN 978-5-907290-61-7

Том 3 монографии посвящен анализу среднего интервала текста. Исследуемый корпус прозы автоматически членится на фрагменты по 40 слов. Если совместная встречаемость двух слов во фрагментах существенно превышает величину, подсчитанную на основе нулевой гипотезы, делается вывод о наличии связи между этими словами. В результате возникает огромная сеть текстуальных связей слов.  Показан способ выявления кластеров в этой сети.

Полностью сеть текстуальных связей слов (26 тысяч слов и 500 тысяч связей) представлена на компакт диске.