Звуковой строй современного русского языка - Л. В. Бондарко 1977

Объективные характеристики звуковых единиц и методы их анализа
Звуки речи на спектрограмме

Рассмотрим, как выглядят спектрограммы различ­ных звуков речи и каким образом по спектрограммам можно судить об изменении качества звука во время его произнесения. Наиболее удобны для этих целей спектрограммы, получаемые на динамическом спектро­графе1.

Гласные. Для всех гласных, как уже было ска­зано, характерно то, что источником звука при их образовании являются колебания голосовых связок. По­этому при дальнейшем рассмотрении этот общий для гласных признак упоминаться не будет, так как нашей задачей является выяснение того, чем гласные отли­чаются друг от друга.

Рис. 15. Мгновенные значения спектров гласных и их динамиче­ские спектрограммы.

Вертикальные штрихи на динамической спектрограмме — отмет­чик времени, расстояние от штриха до штриха—100 мс.

Мгновенные значения спектров имеют преимущество при опре­делении относительной интенсивности частот, составляющих спектр-каждого гласного, однако не дают представления о том, как этот спектр изменяется во времени. Сравните мгновенное значение-спектра и динамическую спектрограмму гласного ы. Динамические спектрограммы показывают изменение спектра звука во времени, но дают более грубое представление об относительной интенсив­ности составляющих спектр частот. В некоторых случаях слабые по интенсивности составляющие могут вообще не фиксироваться на динамической спектрограмме — см. например, гласный у, где-высокие частоты, хорошо видные в мгновенной характеристике спектра, на динамической спектрограмме того же звука отсутст­вуют.

Попытайтесь, используя шкалу частот, определить на динами­ческой спектрограмме, какой именно момент гласного зафиксирован-на соответствующей мгновенной спектрограмме.

Рассмотрим эти различия сначала на примере изо­лированно произнесенных гласных, приведенных на рис. 15. Различия в спектральных характеристиках гласных а, о, е, и, ы, у можно описать, используя только две первые форманты — FI и FII. В спектре каждого из гласных отчетливо выделяются области концентра­ции энергии, которые фиксируются как затемненные полосы.

FI — первое после частоты основного тона (F0) уси­ление в спектре. Для закрытых гласных и, ы, у прове­сти границу между F0 и FI трудно, так как частоты их очень близки, и, как мы уже говорили, каждая форман­та представляет собой не одну, а группу частот. Если мы выделим центральные значения формантных обла­стей гласных, то получим «идеализированные» схемати­ческие изображения спектра (примеры таких спектро­грамм тех же русских гласных см. на рис. 16). На обо­их рисунках видно, что с увеличением степени открыто­сти гласного частота FI повышается и имеет макси­мальное значение для самого открытого гласного а.

Рис. 16. Схематические изображения FI и FI1 гласных.

Здесь изображены спектры гласных, в «идеализированном виде», т. е? так, как будто в них нет никаких других частотных составляющих, кроме F0CH. И первых двух формант.

FII имеет самое высокое значение для переднего гласного и и самое низкое для заднего гласного у. Все остальные гласные расположены между этими двумя в зависимости от степени продвинутости вперед.

Важно заметить, что среди всех гласных ы имеет следующую особенность: если в изолированном произ-1 несении частота FII всех остальных гласных практиче­ски не изменяется на протяжении всего гласного, то. при произнесении гласного ы частота FII в начале звучания гласного ниже, чем в конце. Это его основное, спектральное отличие от гласного и: нетрудно заметить, что они близки по спектру, если не учитывать началь­ного участка звучания.

Обычно гласные произносятся в сочетаниях с согласными. Это накладывает определенный отпечаток на спектр гласного. Под влиянием качества соседнего со­гласного (в первую очередь под влиянием места образо­вания) изменяются частоты FI и FII. Частота FI на границе между согласным и гласным всегда ниже, чем на остальном участке гласного: частота FII на границе согласного с гласным может быть или ниже, или выше — в зависимости от места образования согласного и от качества гласного. На рис. 17 видно, что частота FII сильнее всего изменяется под влиянием предшествующего мягкого согласного: в этих случаях на границе] между согласным и гласным FII имеет более высокую частоту, чем на стационарном участке гласного. Губные] твердые согласные понижают частоту FII гласных а и е переднеязычные твердые значительно повышают! частоту FII гласных о и у.

Рис. 17. Схематические изображения изменения FI и FII русских гласных после разных согласных.

Начало любого гласного, следующего за любым мягким со­гласным, очень похоже по своим свойствам на гласный и: часто­та FI довольно низкая (около 300 Гц), а частота FII — высокая (около 2000 Гц). Обратите внимание на то, что очень редки слу­чаи, когда частоты формант гласного вообще не изменяются под влиянием предшествующего согласного.

Рис. 18. Спектрограммы слогов, в которых гласные содержат переходный участок и стационарный участок.

В слоге ся [с' а] переходный участок характеризуется высоким положением FII, частота которой около 2000 Гц, и низким положе­нием FI. Обратите внимание на то, что длительность этого пере­ходного участка равна почти половине длительности стационарного, а также на то, что к концу стационарного участка интенсивность формант настолько ослабевает, что они не регистрируются на спектрограмме (ср. спектрограммы гласного у на рис. 15).

В слоге уч гласный начинается со стационарного участка, за которым следует переходный, с изменяющейся частотой FII. На­звания «первый переход» и «второй переход» характеризуют лишь место перехода по отношению к стационарному участку, а не ко­личество переходов в данном звуке.

Рис. 19. Спектрограммы слогов мы, нэ, ла, ры, же, ни, ле, ря, нМ

Обратите внимание на то, что спектр сонанта очень похож на спектр гласного. Это в первую очередь объясняется наличием чет­кой формантной структуры и отсутствием шумовых составляющих. На нашем рисунке такие спектры у носовых сонантов и у плавных л и л'. Спектрограммы дрожащих pup' отражают артикуляторную неоднородность — чередование гласноподобиых участков с четкой формантной структурой и участков ослабления звука (артикуляционно — моменты ударов). Сравните р и р' и увидите, что р — многоударный звук, а р' — одноударный (заметим, что иногда он вообще выглядит на спектрограмме как щелевой).

Только спектр среднеязычного сонанта j содержит шумовые составляющие (от 4000 Гц и выше). Обратите внимание на гласно-подобное начало сонанта, приближающееся по частотным характери­стикам формант к гласному и.

На основании неоднородности спектральных (а сле­довательно, и слуховых) характеристик в гласном при­нято выделять следующие участки: стационарный) участок звучания — тот отрезок звучания глас­ного, где частота FI и FII не изменяется и где эти фор­манты максимально близки по частоте к формантам, характеризующим изолированно произнесенный глас­ный; переходные участки: первый переходный участок — это отрезок гласного от конца предшествую­щего согласного (или гласного в случае сочетания двух гласных) до начала стационарного участка; второй переходный участок — от конца стационарного участка до начала следующего согласного (см. рис. 18).

Согласные. По спектральной картине наиболее близкими к гласным являются сонанты. Как и гласные, сонанты имеют голосовой источник и четкую формантную структуру. Наиболее общим акустическим призна­ком, отличающим сонанты от гласных, является их меньшая относительная интенсивность. Важно, однако, заметить, что это различие регулярно наблюдается только в ударных слогах. В безударных слогах относи­тельная интенсивность сонанта может быть равна или даже больше интенсивности гласного.

Носовые сонанты м, м\ н, «' имеют в спектре четко выраженную «форманту назализации», которая распро­страняется и на соседний гласный. Специфической осо­бенностью спектра дрожащего сонанта р являются пе­риодические ослабления интенсивности и формантной структуры, соответствующие артикуляционно моментам «ударов», (см. рис. 19).

Спектрограмма / очень близка к спектру гласного и, но имеет шумовые составляющие в высоких областях (см. рис. 19).

Наиболее специфическим является распределение спектральных составляющих, характеризующих глу­хие взрывные согласные. При их образовании, как уже говорилось, действует импульсный шумовой источ­ник. Составляющие спектра распределены практически по всей полосе частот, а длительность взрыва очень мала. На рис. 20 приведены спектрограммы слогов с начальными глухими взрывными согласными. Так как акустически глухая смычка этих согласных реализуется как пауза, то единственным «представителем» согласного является чрезвычайно короткий и спектрально не­определенный взрыв.

Рис. 20. Спектрограммы слогов с начальными глухими взрыв­ными согласными. Стрелкой отмечен импульсный шум взрыва.

Губной согласный п имеет самый слабый по интенсивности шум, переднеязычный т — более интенсивный, заднеязычный к — са­мый интенсивный. Сравните эти характеристики с осциллографическим изображением глухих взрывных согласных на рис. 11.

Рис. 21. Спектрограммы слогов с начальными звонкими взрыв­ными согласными. Стрелкой отмечен импульсный шум взрыва. Малая интенсивность шума при образовании губно-губного б приводит к тому, что на спектрограмме этот шум не фиксируется.

Как и на осциллографических кривых, на спектрограммах заднеязычный обладает наиболее длительным и интенсивным шумом. Звонкая смычка во всех случаях регистрируется как интенсивное Усиление в области низких частот.

Рис. 22. Спектрограммы слогов с глухими щелевыми (фэ, со, ша, ха).

Обратите внимание на то, что губной согласный ф, как и на осциллограмме, характеризуется небольшой длительностью и малой интенсивностью шумовых составляющих (см. рис. 10),

Рис. 23. Спектрограммы слогов со звонкими щелевыми (во, за, жу).

Обратите внимание на слабую интенсивность шумовых состав­ляющих в спектре губно-зубного а.

Все звонкие согласные начинаются с гласноподобного участка, что на спектрограмме проявляется в том, что низкочастотные со­ставляющие голосового источника усилены, наблюдается усиление в области FII, а шумовые составляющие ослаблены. С усилением шума низкочастотные составляющие ослабляются.

Звонкие взрывные согласные образуются при участии двух источников — шумового и голосового. В их спектре это отражается следующим образом: во время смычки, когда действует голосовой источник, но проход воздушной струи закрыт, имеются низкочастотные со­ставляющие в области частоты основного тона голоса; в момент взрыва, когда включается и шумовой источ­ник, появляются шумовые составляющие в широкой по­лосе частот, однако интенсивность их, как правило, меньше, чем у соответствующих глухих согласных (см. рис. 21).

Мягкие взрывные согласные, глухие и звонкие, характеризуются большей длительностью взрыва, кото­рый в результате значительной аффрикатизации мягких взрывных имеет спектральные характеристики, близкие к характеристикам соответствующих щелевых соглас­ных.

Глухие щелевые согласные, образующиеся при участии турбулентного шумового источника, характери­зуются более определенными частотными областями, чем взрывные. На рис. 22 приведены спектрограммы слогов с согласными ф, с, х, ш, на которых хорошо вид­но следующее: из всех согласных х характеризуется са­мой узкой по ширине и самой низкой по частоте поло­сой усиленных частот; ш имеет самую широкую полосу частот; с занимает промежуточные положения по шири­не полосы, но собственная частота шума в тех же фо­нетических условиях всегда выше для с, чем для ф и ш. Губно-зубной ф отличается от всех этих согласных очень слабой интенсивностью шума.

Звонкие щелевые согласные отличаются от глухих щелевых не только появлением низкочастотных составляющих, вызванных включением голосового ис­точника, но и заметным ослаблением шумовых состав­ляющих по сравнению с соответствующими глухими согласными. В спектре шумовые составляющие очень слабы, так что на спектрограмме они могут вообще не фиксироваться (см. рис. 23).

Аффрикаты характеризуются, с одной стороны, наличием глухой смычки, как взрывные согласные (аку­стически глухая смычка реализуется как пауза), и наличием щелевой фазы после смычки" (эта фаза реа­лизуется как высокочастотный шум, близкий по спект­ральным характеристикам к шуму соответствующих щелевых) (см. рис. 24).

Рассмотренные здесь спектральные характеристики звуков русской речи не являются исчерпывающими и постоянными. Это обусловлено двумя обстоятельства­ми, одинаково важными, но имеющими разную при­роду. Первое обстоятельство, которое не позволяет рас­пространить такое описание на весь речевой материал, связано с индивидуальными особенностями произноше­ния. Так, частотные характеристики FI, FII и более высоких формант гласных и согласных могут изменять­ся у разных говорящих. Это связано с особенностями речевых органов и произносительных навыков говоря­щих.

Индивидуальные особенности произношения, никем еще систематически не изученные, делают необходимым при описании спектральных характеристик звуков речи вводить довольно широкий разброс значений почти всех этих характеристик.

Рис. 24. Спектрограммы слогов с аффрикатами (ца и ча).

Сравните эти спектрограммы со спектрограммами глухих ще­левых согласных (рис. 22) и увидите, что щелевая фаза аффрикат близка по характеристикам к соответствующим щелевым соглас­ным, но отличается меньшей длительностью.

Вторая причина изменения собственных характери­стик звуков в потоке речи заключается в том, что фо­нетическое положение данного звука влияет на его об­разование в каждом конкретном случае. Для гласных существенным оказывается и положение по отноше­нию к ударению, и качество соседних со­гласных. Для согласных, кроме этих двух обстоятельств, важно и их положение в речевой цепи — абсолютное начало или абсолютный конец слова, фразы. Все разнообразие акустических характеристик звуков в речевом потоке будет рассмотрено в следую­щей главе этой книги.