О чем речь - Ирина Левонтина 2016
Наука и жизнь
Русский национальный
Вот уже более десяти лет существует Национальный корпус русского языка. НКРЯ — «это информационно-справочная система, основанная на собрании русских текстов в электронной форме». Сейчас общий объем Корпуса — более 500 млн слов. Делает его блестящая команда лингвистов — специалистов по так называемой корпусной лингвистике, при участии разных организаций, прежде всего Яндекса и Института русского языка им. В. В. Вино градова РАН. Отметим, что в мире корпусная лингвистика вообще сейчас бурно развивается, ср., например, один из образцовых корпусов — Британский национальный кор пус (BNC).
Корпус — не просто большое собрание текстов. Это собрание сбалансированное (тексты разного типа отобраны в определенной пропорции). К тому же для конкретной задачи можно выбрать тексты того или иного жанра, времени и т. п. Например, можно за дать такой подкорпус: поэтические тексты с автором — женщиной до 1950 года рождения. Искать по массиву текстов можно определенную словоформу или сочетание слов, а также два или более слов, находящихся в тексте на указанном расстоянии друг от друга, а также можно задать не слово, а грамматическую форму (допустим, чтобы изучить модель управления глагола). И много еще чего можно делать. И разумеется, со всяческой статистикой.
Например, когда я пыталась выяснить, как за последние сто лет изменилось произношение слова артель (о нем есть рассказ в этой книжке), я воспользовалась, в частности, МУРКО — мультимедийным корпусом, входящим в НКРЯ. Как же было здорово, нажав кнопку, моментально получить одиннадцать отрывочков из фильмов, где это слово произносят! Замечательно, что Корпус все рас тет и растет, а его поисковые инструменты всё изощряются и изощряются. Собственно, это можно посмотреть на сайте НКРЯ — http://www.ruscorpora.ru.
С появлением НКРЯ жизнь лингвистов-русистов очень украсилась. То, на что у нас раньше уходили годы (выискивание примеров по текстам, сортировка пыльных карточек с вы писанными контекстами), теперь достигается за несколько секунд и в гораздо большем объеме. А для лексикографов настала просто райская жизнь! Правда, замечу, что это привело и к появлению большого количества лингвистических работ, выполненных по принципу «наливай и пей»: прогоняешь какое-нибудь слово через Корпус — и готово дело. А там есть еще такая чудная кнопочка — «Показать распределение по годам». Нажимаешь — и выскакивает красивый график. И пожалуйста — научная статья: вот, мол, такое-то слово, в такие-то годы столько-то, вот столько-то процентов во множественном числе, а в таком-то жанре столько-то. Хочется спросить: «И?» В молодом поколении лингвистов многие убеждены, что именно так выглядит настоящая наука, а, скажем, проводимый вручную тонкий семантический анализ — так, пережитки прошлого. Ну да ничего, будем надеяться, что это детская болезнь и она пройдет.
Помимо собственно научной работы, Корпус еще изумителен тем, что теперь можно получать какие-то предварительные ответы на возникающие в ходе жизни лингвистические вопросы. Дело в том, что наш индивидуальный языковой опыт очень ограничен и обычно слабо отрефлектирован. И Корпус позволяет нам выйти за его пределы. При веду несколько примеров из последнего времени.
Подруга-редактор спросила меня, насколько вообще допустимо тавтологическое сочетание «денежные купюры». Это очень легкий вопрос для Корпуса (денежный + купюра на расстоянии 1 — то есть рядом). Оказывается, такое встречается нечасто (48 вхождений при том, что само слово купюра зафиксировано 1430 раз), но, в частности, и у хороших авторов: С. Довлатова, И. Грековой, В. Дудинцева, А. Азольского, Д. Рубиной и др. Ну а дальше — дальше каждый сам решает, достаточные ли это для него авторитеты.
Или вот в последнее время многие заметили, что помимо нормативного варианта в Дон бассе и из Донбасса в литературной речи начал распространяться вариант на Донбассе и с Донбасса (понятное дело, региональное влияние). Тут надо заметить, что как раз в данном случае провести серьезное социолингвистическое исследование с привязкой к территориям НКРЯ (пока) возможности не дает. В рассказе про поребрик (он тоже есть в этой книжке) я упоминала не которые другие инструменты, которые можно тут использовать. Но Корпус позволяет быстро прикинуть, действительно ли раньше в литературной речи такого не встречалось. Как выражался В. С. Черномырдин, «Сроду такого не было, и вот опять то же самое».
Вообще-то этот вариант и раньше встречался — и у приличных авторов:
Мои родители, которые всю жизнь зачем-то колесили по всем доступным им пространствам, привезли меня из Таджи кистана в город Первомайск на Донбассе (В. Войнович. Замысел, 1999). Бабка моя даже завидовала, что сестра успела походить в мехах и бриллиантах, пока она с мужем ра ботала то в Карелии, то на Донбассе (В. Курбатов. Дорога в объезд, 1999).
Так на Донбассе и остался на эту зиму: что-то там с железными дорогами (И. Ратушинская. Одесситы, 1998).
Но, конечно, довольно редко, в Донбассе — во много раз чаще. Интересно, что аналогичное с Донбасса попадается почаще, причем есть и довольно старые примеры:
Я вот мастер коксовых печей, с Донбасса, а приехал сюда — печей-то еще не построили, послали меня на работу в профорганизацию (А. Г. Малышкин. Люди из захолустья, 1938).
Я еще мог бы понять, если наша армия послана для демонстрации, чтобы любой це ной оттянуть силы белых с Донбасса (А. Н. Толстой. Хму рое утро, 1941).
Но у Лимонова, например, более стандартно:
Маленький гениальный еврей, недоучившийся в Горном институте, бежал в Харьков из Донбасса, где он вот уже несколько лет работал мастером на шахте (Молодой негодяй, 1985).
Я очень люблю пользоваться поэтическим корпусом НКРЯ для уточнения вопросов, связанных с ударением (слава русской силлаботонике!). Недавно по понятному по воду (как раз соткался из злобы, невежества и серой паутины термин национал-предатели) в сети обсуждали стихотворение Демьяна Бедного 1923 года «Социал-траурным предателям»:
В бессильном трауре немецкая столица,
Повсюду траурные лица.
Что ни процессия, то — вот она, гляди! —
Колонна социал-прохвостов впереди,
Предате ли! Трусы! Забейте ватой уши
И трауром густым закройте зеркала:
Вы обнажили до гола
Свой развращенный ум и слякотные души!
Многие обратили внимание на странное ударение трусы вместо трусы. Народ очень веселился, шутил, что, мол, с бель ем все очень логично выходит — трусы обнажили догола свой развращенный ум. В общем, поэта каждый может обидеть, но Корпус говорит нам, что та кой вариант ударения у этого слова был:
Фелицы слава, слава Бога,
Который брани усмирил,
…………………………………
Который оком лучезарным
Шутам, трусам, неблагодарным
И праведным свой свет дарит.
(Г. Р. Державин. Фелица, 1782)
Что забывших про долг и про честь
Беглецов и предателей много
У несчастной их родины есть;
Что трусов малодушных не счесть;
Но что больше всего равнодушных,
Беззаботно насилью послушных
(М. О. Цетлин (Амари). Аист, 1906)
Разумеется, это не ответ на вопрос, почему у Демьяна Бедного такое ударение: тут надо было бы подробнее смотреть диалекты, исследовать его язык, надо изучить историю этого слова. Но мы можем сразу сказать, что не то чтобы тут поэт переставил ударение, чтобы слово влезло в стих, не станем дразнить его, как у Горького Настя Барона: «Не было этого! Ничего не было!» Я ужасно не люблю, когда в сети такие Насти авторитетно заявляют: так, мол, никогда не говорили, такого не бывает, да еще и объясняют почему. У меня всегда в таких случаях рука сама так и тянется к закладке «НКРЯ». Хорошо, что она есть.