Звуковой строй современного русского языка - Л. В. Бондарко 1977
Объективные характеристики звуковых единиц и методы их анализа
Cпектрографы
Получить спектр какого-либо звука — это значит получить совокупность значений амплитуд всех частотных составляющих, образующих данный звук1. Для получения спектров звуков речи используются приборы, называемые анализаторами спектров (спектрографами).
Основным принципом работы спектрографов является использование электрических фильтров, что требует предварительного преобразования звукового колебания в электрическое. Сами электрические фильтры можно сравнить с ячейками-сита, имеющими различные размеры: через каждую ячейку может пройти предмет, диаметр которого не превышает диаметра ячейки. Так и электрические фильтры пропускают только ток с той частотой, которая совпадает с их собственной.
Электрические фильтры, используемые в спектрографах, играют роль резонаторов, о которых рассказано в первом разделе. Представим себе, что звук речи, преобразованный в электрические колебания, попадает на систему электрических фильтров, каждый из которых имеет собственные частотные характеристики. Тогда из всего набора электрических фильтров на подаваемый звук будут «откликаться» только те, собственная частота которых близка или совпадает с частотами, содержащимися в исследуемом звуке. При этом «отклик» в каждом фильтре будет тем сильнее, чем более интенсивна данная частота в спектре звука.
Такой спектр называется амплитудно-частотным.
Рис. 13. а — График изменения частоты основного тона во фразе ВОТ ЭТО зимний пейзаж; б — Интонограмма фразы Вот это зимний пейзаж.
а. Сравним графики, полученные при измерении частоты основного тона по трем периодам и в среднем для каждого гласного, и обнаружим, что общие характеристики основного тона совпадают: и на том и на другом графике видно, что частота основного тона довольно низкая на первом гласном, повышается на гласном е в слове это, сохраняет высокое значение на втором гласном этого слова. Затем частота довольно сильно понижается, но на предударном гласном слова пейзаж опять наблюдается некоторое повышение. Самая низкая частота — на ударном гласном слова пейзаж. Обратите внимание на то, что совпадение наблюдается лишь в общих характеристиках, тогда как некоторые подробности изменения частоты основного тона вовсе ускользают при определении средних значений: так, в слове это на ударном гласном — повышение частоты от начала к концу гласного, а на заударном гласном — понижение. Более грубая и простая картина получается и в других случаях.
б. На интонограмме той же фразы записано следующее: в самой нижней части — счетчик периодов основного тона, затем — огибающая частоты основного тона, далее следует осциллограмма Фразы и, наконец, огибающая интенсивности. Рассмотрим внимательно этот рисунок и увидим, что общий характер изменения частоты основного тона здесь представлен хорошо: как и на графиках, здесь видно, что максимальное значение частоты — на гласных в слове это, минимальное — на ударном гласном слова пейзаж. На этом рисунке видно также и изменение частоты на протяжении звука; заметим, однако, что различия между гласными здесь заметны хуже, чем на графике, а сама кривая «отстает» от осциллограммы фразы на некоторое время.
Весь диапазон частот, существенных для звука речи, может быть разбит на определенное число шагов, каждый из которых будет представлен одним фильтром. Ширина фильтра может меняться в зависимости от конструкции прибора. Если ширина фильтра велика, например 300 или 500 Гц, то это значит, что данный фильтр будет откликаться на большое количество частот, разница между которыми может достигать 300 и 500 Гц.
В современных спектрографах весь диапазон от 50 до 10000 Гц разбивается на 30—40 полос. Фильтры имеют разную ширину в зависимости от того, какую часть диапазона они охватывают: на низких частотах ширина фильтров уже, на высоких — шире.
Однако в ряде приборов фильтры выбираются так, чтобы имелось некоторое перекрытие их частот: так, например, на низких частотах могут быть представлены следующие фильтры: 50—200 Гц, 50—300 Гц, так что одна и та же частота исследуемого звука попадает на несколько фильтров и вызывает их возбуждение. Это объясняется стремлением более тщательно исследовать, в какой именно области спектра находится та или иная частотная составляющая.
Ниже приводятся характеристики набора фильтров одного из спектрометров, который используется в фонетических исследованиях (см. табл. на стр. 57).
Как видим, на низких частотах ширина фильтров довольно большая (около 300 Гц), но имеется значительное перекрытие частот фильтров: так, третий фильтр пропускает частоты от 75 до 375 Гц, четвертый — от 150 до 450 Гц, а пятый — от 225 до 525 Гц. Предположим, что в исследуемом звуке имеется усиление около 300 Гц. Это усиление вызовет возбуждение во всех трех фильтрах, но максимальное будет в том фильтре, средняя частота которого ближе всего к исследуемой частоте. По средним частотам расстояние между фильтрами составляет меньше 100 Гц в низкой части спектра и постепенно увеличивается в высокой части спектра.
Кроме анализа с помощью набора фильтров (который называется параллельным анализом), используют и так называемый последовательный анализ. Сущность его заключается в следующем: звук речи или последовательность звуков записываются или на специальный магнитный диск, или же на магнитную ленту, из которой затем склеивается кольцо. Этим достигается возможность многократного повторения одного и того же звука. При анализе используется один фильтр, имеющий постоянную ширину, но перестраивающийся по частоте. Обычно употребляют два типа фильтров при последовательном анализе — один с узкой полосой (45 Гц), второй с широкой полосой (300 Гц). При узкополосном фильтре весь спектр звука разбивается на шаги по 45 Гц, при широкополосном — на шаги по 300 Гц. Достигается это следующим образом: записанный на магнитный диск или кольцо звук подается на анализирующее устройство. При первом воспроизведении этого звука частота фильтра самая низкая (обычно 85—130 Гц); при повторном воспроизведении частота фильтра уже изменяется, и он реагирует на более высокие составляющие (175—220 Гц), при третьем повторении частота фильтра—265—310 Гц и т. д.
Таким образом, звук должен повториться столько раз, сколько нужно изменений частоты фильтра в полосе, характеризующей звуки речи (т. е. в полосе 50— 10 000 Гц). При последовательном анализе время, затрачиваемое на анализ, гораздо больше времени самого звучания, тогда как параллельный анализ совершается за время, в течение которого происходит звучание. Преимуществом последовательного анализа является возможность более точного исследования спектральных составляющих.