Звуковой строй современного русского языка - Л. В. Бондарко 1977
Объективные характеристики звуковых единиц и методы их анализа
Звуки речи на спектрограмме
Рассмотрим, как выглядят спектрограммы различных звуков речи и каким образом по спектрограммам можно судить об изменении качества звука во время его произнесения. Наиболее удобны для этих целей спектрограммы, получаемые на динамическом спектрографе1.
Гласные. Для всех гласных, как уже было сказано, характерно то, что источником звука при их образовании являются колебания голосовых связок. Поэтому при дальнейшем рассмотрении этот общий для гласных признак упоминаться не будет, так как нашей задачей является выяснение того, чем гласные отличаются друг от друга.
Рис. 15. Мгновенные значения спектров гласных и их динамические спектрограммы.
Вертикальные штрихи на динамической спектрограмме — отметчик времени, расстояние от штриха до штриха—100 мс.
Мгновенные значения спектров имеют преимущество при определении относительной интенсивности частот, составляющих спектр-каждого гласного, однако не дают представления о том, как этот спектр изменяется во времени. Сравните мгновенное значение-спектра и динамическую спектрограмму гласного ы. Динамические спектрограммы показывают изменение спектра звука во времени, но дают более грубое представление об относительной интенсивности составляющих спектр частот. В некоторых случаях слабые по интенсивности составляющие могут вообще не фиксироваться на динамической спектрограмме — см. например, гласный у, где-высокие частоты, хорошо видные в мгновенной характеристике спектра, на динамической спектрограмме того же звука отсутствуют.
Попытайтесь, используя шкалу частот, определить на динамической спектрограмме, какой именно момент гласного зафиксирован-на соответствующей мгновенной спектрограмме.
Рассмотрим эти различия сначала на примере изолированно произнесенных гласных, приведенных на рис. 15. Различия в спектральных характеристиках гласных а, о, е, и, ы, у можно описать, используя только две первые форманты — FI и FII. В спектре каждого из гласных отчетливо выделяются области концентрации энергии, которые фиксируются как затемненные полосы.
FI — первое после частоты основного тона (F0) усиление в спектре. Для закрытых гласных и, ы, у провести границу между F0 и FI трудно, так как частоты их очень близки, и, как мы уже говорили, каждая форманта представляет собой не одну, а группу частот. Если мы выделим центральные значения формантных областей гласных, то получим «идеализированные» схематические изображения спектра (примеры таких спектрограмм тех же русских гласных см. на рис. 16). На обоих рисунках видно, что с увеличением степени открытости гласного частота FI повышается и имеет максимальное значение для самого открытого гласного а.
Рис. 16. Схематические изображения FI и FI1 гласных.
Здесь изображены спектры гласных, в «идеализированном виде», т. е? так, как будто в них нет никаких других частотных составляющих, кроме F0CH. И первых двух формант.
FII имеет самое высокое значение для переднего гласного и и самое низкое для заднего гласного у. Все остальные гласные расположены между этими двумя в зависимости от степени продвинутости вперед.
Важно заметить, что среди всех гласных ы имеет следующую особенность: если в изолированном произ-1 несении частота FII всех остальных гласных практически не изменяется на протяжении всего гласного, то. при произнесении гласного ы частота FII в начале звучания гласного ниже, чем в конце. Это его основное, спектральное отличие от гласного и: нетрудно заметить, что они близки по спектру, если не учитывать начального участка звучания.
Обычно гласные произносятся в сочетаниях с согласными. Это накладывает определенный отпечаток на спектр гласного. Под влиянием качества соседнего согласного (в первую очередь под влиянием места образования) изменяются частоты FI и FII. Частота FI на границе между согласным и гласным всегда ниже, чем на остальном участке гласного: частота FII на границе согласного с гласным может быть или ниже, или выше — в зависимости от места образования согласного и от качества гласного. На рис. 17 видно, что частота FII сильнее всего изменяется под влиянием предшествующего мягкого согласного: в этих случаях на границе] между согласным и гласным FII имеет более высокую частоту, чем на стационарном участке гласного. Губные] твердые согласные понижают частоту FII гласных а и е переднеязычные твердые значительно повышают! частоту FII гласных о и у.
Рис. 17. Схематические изображения изменения FI и FII русских гласных после разных согласных.
Начало любого гласного, следующего за любым мягким согласным, очень похоже по своим свойствам на гласный и: частота FI довольно низкая (около 300 Гц), а частота FII — высокая (около 2000 Гц). Обратите внимание на то, что очень редки случаи, когда частоты формант гласного вообще не изменяются под влиянием предшествующего согласного.
Рис. 18. Спектрограммы слогов, в которых гласные содержат переходный участок и стационарный участок.
В слоге ся [с' а] переходный участок характеризуется высоким положением FII, частота которой около 2000 Гц, и низким положением FI. Обратите внимание на то, что длительность этого переходного участка равна почти половине длительности стационарного, а также на то, что к концу стационарного участка интенсивность формант настолько ослабевает, что они не регистрируются на спектрограмме (ср. спектрограммы гласного у на рис. 15).
В слоге уч гласный начинается со стационарного участка, за которым следует переходный, с изменяющейся частотой FII. Названия «первый переход» и «второй переход» характеризуют лишь место перехода по отношению к стационарному участку, а не количество переходов в данном звуке.
Рис. 19. Спектрограммы слогов мы, нэ, ла, ры, же, ни, ле, ря, нМ
Обратите внимание на то, что спектр сонанта очень похож на спектр гласного. Это в первую очередь объясняется наличием четкой формантной структуры и отсутствием шумовых составляющих. На нашем рисунке такие спектры у носовых сонантов и у плавных л и л'. Спектрограммы дрожащих pup' отражают артикуляторную неоднородность — чередование гласноподобиых участков с четкой формантной структурой и участков ослабления звука (артикуляционно — моменты ударов). Сравните р и р' и увидите, что р — многоударный звук, а р' — одноударный (заметим, что иногда он вообще выглядит на спектрограмме как щелевой).
Только спектр среднеязычного сонанта j содержит шумовые составляющие (от 4000 Гц и выше). Обратите внимание на гласно-подобное начало сонанта, приближающееся по частотным характеристикам формант к гласному и.
На основании неоднородности спектральных (а следовательно, и слуховых) характеристик в гласном принято выделять следующие участки: стационарный) участок звучания — тот отрезок звучания гласного, где частота FI и FII не изменяется и где эти форманты максимально близки по частоте к формантам, характеризующим изолированно произнесенный гласный; переходные участки: первый переходный участок — это отрезок гласного от конца предшествующего согласного (или гласного в случае сочетания двух гласных) до начала стационарного участка; второй переходный участок — от конца стационарного участка до начала следующего согласного (см. рис. 18).
Согласные. По спектральной картине наиболее близкими к гласным являются сонанты. Как и гласные, сонанты имеют голосовой источник и четкую формантную структуру. Наиболее общим акустическим признаком, отличающим сонанты от гласных, является их меньшая относительная интенсивность. Важно, однако, заметить, что это различие регулярно наблюдается только в ударных слогах. В безударных слогах относительная интенсивность сонанта может быть равна или даже больше интенсивности гласного.
Носовые сонанты м, м\ н, «' имеют в спектре четко выраженную «форманту назализации», которая распространяется и на соседний гласный. Специфической особенностью спектра дрожащего сонанта р являются периодические ослабления интенсивности и формантной структуры, соответствующие артикуляционно моментам «ударов», (см. рис. 19).
Спектрограмма / очень близка к спектру гласного и, но имеет шумовые составляющие в высоких областях (см. рис. 19).
Наиболее специфическим является распределение спектральных составляющих, характеризующих глухие взрывные согласные. При их образовании, как уже говорилось, действует импульсный шумовой источник. Составляющие спектра распределены практически по всей полосе частот, а длительность взрыва очень мала. На рис. 20 приведены спектрограммы слогов с начальными глухими взрывными согласными. Так как акустически глухая смычка этих согласных реализуется как пауза, то единственным «представителем» согласного является чрезвычайно короткий и спектрально неопределенный взрыв.
Рис. 20. Спектрограммы слогов с начальными глухими взрывными согласными. Стрелкой отмечен импульсный шум взрыва.
Губной согласный п имеет самый слабый по интенсивности шум, переднеязычный т — более интенсивный, заднеязычный к — самый интенсивный. Сравните эти характеристики с осциллографическим изображением глухих взрывных согласных на рис. 11.
Рис. 21. Спектрограммы слогов с начальными звонкими взрывными согласными. Стрелкой отмечен импульсный шум взрыва. Малая интенсивность шума при образовании губно-губного б приводит к тому, что на спектрограмме этот шум не фиксируется.
Как и на осциллографических кривых, на спектрограммах заднеязычный обладает наиболее длительным и интенсивным шумом. Звонкая смычка во всех случаях регистрируется как интенсивное Усиление в области низких частот.
Рис. 22. Спектрограммы слогов с глухими щелевыми (фэ, со, ша, ха).
Обратите внимание на то, что губной согласный ф, как и на осциллограмме, характеризуется небольшой длительностью и малой интенсивностью шумовых составляющих (см. рис. 10),
Рис. 23. Спектрограммы слогов со звонкими щелевыми (во, за, жу).
Обратите внимание на слабую интенсивность шумовых составляющих в спектре губно-зубного а.
Все звонкие согласные начинаются с гласноподобного участка, что на спектрограмме проявляется в том, что низкочастотные составляющие голосового источника усилены, наблюдается усиление в области FII, а шумовые составляющие ослаблены. С усилением шума низкочастотные составляющие ослабляются.
Звонкие взрывные согласные образуются при участии двух источников — шумового и голосового. В их спектре это отражается следующим образом: во время смычки, когда действует голосовой источник, но проход воздушной струи закрыт, имеются низкочастотные составляющие в области частоты основного тона голоса; в момент взрыва, когда включается и шумовой источник, появляются шумовые составляющие в широкой полосе частот, однако интенсивность их, как правило, меньше, чем у соответствующих глухих согласных (см. рис. 21).
Мягкие взрывные согласные, глухие и звонкие, характеризуются большей длительностью взрыва, который в результате значительной аффрикатизации мягких взрывных имеет спектральные характеристики, близкие к характеристикам соответствующих щелевых согласных.
Глухие щелевые согласные, образующиеся при участии турбулентного шумового источника, характеризуются более определенными частотными областями, чем взрывные. На рис. 22 приведены спектрограммы слогов с согласными ф, с, х, ш, на которых хорошо видно следующее: из всех согласных х характеризуется самой узкой по ширине и самой низкой по частоте полосой усиленных частот; ш имеет самую широкую полосу частот; с занимает промежуточные положения по ширине полосы, но собственная частота шума в тех же фонетических условиях всегда выше для с, чем для ф и ш. Губно-зубной ф отличается от всех этих согласных очень слабой интенсивностью шума.
Звонкие щелевые согласные отличаются от глухих щелевых не только появлением низкочастотных составляющих, вызванных включением голосового источника, но и заметным ослаблением шумовых составляющих по сравнению с соответствующими глухими согласными. В спектре шумовые составляющие очень слабы, так что на спектрограмме они могут вообще не фиксироваться (см. рис. 23).
Аффрикаты характеризуются, с одной стороны, наличием глухой смычки, как взрывные согласные (акустически глухая смычка реализуется как пауза), и наличием щелевой фазы после смычки" (эта фаза реализуется как высокочастотный шум, близкий по спектральным характеристикам к шуму соответствующих щелевых) (см. рис. 24).
Рассмотренные здесь спектральные характеристики звуков русской речи не являются исчерпывающими и постоянными. Это обусловлено двумя обстоятельствами, одинаково важными, но имеющими разную природу. Первое обстоятельство, которое не позволяет распространить такое описание на весь речевой материал, связано с индивидуальными особенностями произношения. Так, частотные характеристики FI, FII и более высоких формант гласных и согласных могут изменяться у разных говорящих. Это связано с особенностями речевых органов и произносительных навыков говорящих.
Индивидуальные особенности произношения, никем еще систематически не изученные, делают необходимым при описании спектральных характеристик звуков речи вводить довольно широкий разброс значений почти всех этих характеристик.
Рис. 24. Спектрограммы слогов с аффрикатами (ца и ча).
Сравните эти спектрограммы со спектрограммами глухих щелевых согласных (рис. 22) и увидите, что щелевая фаза аффрикат близка по характеристикам к соответствующим щелевым согласным, но отличается меньшей длительностью.
Вторая причина изменения собственных характеристик звуков в потоке речи заключается в том, что фонетическое положение данного звука влияет на его образование в каждом конкретном случае. Для гласных существенным оказывается и положение по отношению к ударению, и качество соседних согласных. Для согласных, кроме этих двух обстоятельств, важно и их положение в речевой цепи — абсолютное начало или абсолютный конец слова, фразы. Все разнообразие акустических характеристик звуков в речевом потоке будет рассмотрено в следующей главе этой книги.