Леонид БлехерСтатья была написана для сборника "МКЩ", редактор и составитель Оксана Савоскул. Здесь публикуется полная авторская редакция. Работа продолжаетсяНастоящая статья представляет собой попытку представить в первом приближении и в общих чертах результаты статистического анализа лексики текстов песен Михаила Щербакова. Материалом для анализа послужили тексты 280 песен, написанных в период между 1981-м и 2005-м годами, в разном виде опубликованные автором. Базовая обработка исходного массива была проведена Сергеем Трифоновым с помощью программных средств компании «Яндекс», с последующей детальной доработкой в «ручном режиме». Нужно отметить, что результаты анализа нельзя считать совершенно точными, в силу прежде всего изначально условной регламентированности самого языка вообще, и художественной речи в особенности. Семантическая неоднозначность некоторых слов сделали затруднительным более точный учет: во многих случаях разные по смыслу слова учитывались как одно, в том числе из-за невозможности выделить приоритетное значение. Например, слово «великий» (как большой и как значительный), «небеса» (как небосклон и как рай), «отвечать» (чему-либо или за что-то), и т.п. Многозначность служебных слов еще менее поддаётся семантической дифференциации.
Самые короткие песни - «Седьмой трамвай» (69 слов) и «Тема покоя» (71 слово). Самые длинные песни - «Баб-Эль-Мандебский пролив» (596 слов) и «Предположим» (575 слов).
Собственных имен - приблизительно 440 слов. Из них топонимов - около 190 (43% от общего числа имен собственных), личных имен - около 160 (36% от общего числа имен собственных).
Общий объем проанализированного массива - 60687 слов. Для наглядности статистической картины мы построили распределение по следующим частям речи:
Общая картина распределения такова:
Если учитывать только различные, неповторяющиеся слова, то картина такова:
Статистика по отдельным частям речи1. СуществительныеДесять самых употребляемых существительных и их количество
Существительные с самой низкой частотой
Т.е., около половины всех существительных употреблялось по одному, два, три и четыре раза.
Глаголы с самой низкой частотой
Т.е., более трети всех глаголов употреблялось по одному, два, три и четыре раза.
Прилагательные с самой низкой частотой
Т.е., около половины всех прилагательных употреблялось по одному, два, три и четыре раза.
Слова с самой низкой частотой
5. Служебные слова: союзы, частицы, предлоги и т.п.Десять самых употребительных слов этой категории и их количество
Слова с самой низкой частотой
|