logo
1 половина

3.4. Фонемы

Понятие "форманта" относится к спектральному составу звуков речи. При переходе к семантическому (смысловому) рассмотрению звуков речи употребляют термин "фонема". Фонема - типизированная, образцовая форма звуков речи. Это то, что че­ловек намеревается произнести, а звук речи - это то, что он фактически произносит. Фонему сравнивают с образцово, кал­лиграфически написанными буквами (графемами) в отличие от множества форм рукописного изображения букв.

Речь состоит из звуков, слогов, слов, фраз и более круп­ных построений - периодов. За первичное смысловое понятие в языке принимают слово. Но наименьшим элементом речи считается звук. Точного определения понятия звуков нет.

Образный подход к понятию звука находят в сравнении звуков с письменными элементами речи - буквами. Начертание букв определяется индивидуальностью человека. То же самое можно сказать о произношении звуков. Произношение звуков зависит от их положения в слове, ударения, интонации. Сложные звуки (слоги, слова) в фонетическом отношении не являют­ся простыми цепочками, последовательностями фонем, т.к. фо­нема в одном сочетании имеет одну форму, в другом - иную. Исследователи насчитывают несколько тысяч звуков речи, от­личающихся друг от друга. Поэтому процесс распознавания фо­нем имеет статистический характер. Несмотря на это разнооб­разие все же была проведена классификация и типизация звуков речи, приведшая к возникновению понятия "фонема".

Звуки в изолированном виде употребляются редко, хотя и в этом случае звуки принимают за слово. Это возгласы, междометия, союзы вида "а!", "о!", "и", "у". В словах, являющихся наи­меньшими смысловыми единицами, звуки соединены между со­бою в слоги. Но слоги, как и звуки, обычно самостоятельно не существуют. Границы между слогами так же трудно определить, как и между звуками речи. Границы между словами различаются более ясно, хотя ряд слов при беглом произношении сливаются в одно целое. Эти обстоятельства затрудняют построение уст­ройств автоматического анализа и синтеза речи.

Слитное звучание характерно для произношения предлогов, союзов и других коротких слов. Некоторая связь обнаруживается даже между протяженными словами. Вероятность появления каждого звука и его произношения зависят от пред­шествующего и последующего звуков. В свою очередь слова во фразах и интонация при их произношении связаны друг с дру­гом по смыслу.

Индивидуальные особенности речи характеризуются абсолютными параметрами - положением частей речеобразующего тракта (языка, рта, губ) и относительными парамет­рами (формой и степенью напряжения голосовых связок), оп­ределяющими частоту основного тона. Каждый звук речи харак­теризуется частотой основного тона, формой и положением на оси частот формант.

В русском языке насчитывают 41 основную и 3 неясно звучащие фонемы: 6 гласных (а, о, у, э, и, ы), одну полугласную (й) и 34 согласных. Гласные звуки я, ю, ё, е соответствуют состав­ным фонемам йа, йу, йо.,йэ. Согласных фонем больше, чем -согласных букв, т.к. : ряд согласных букв соответствуют двум фонемам: мягкой и твердой. Только твердых фонем - три (ш, ж, ц) только мягких - одна (ч). Остальные 15 существуют в двух формах: мягкой и твердой.

По характеру звучания звуки речи подразделяют на звонкие и глухие. Первые образуются с участием голосовых связок. Находясь под напряжением, они под действием воздушного потока, идущего из легких, периодически раздвигаются. В резуль­тате создается прерывистый, импульсный поток воздуха. Им­пульсы следуют примерно с постоянной частотой. При произне­сении глухих звуков голосовые связки расслаблены, не вибри­руют, и поток воздуха свободно проходит в полость рта и здесь, встречая на своем пути преграды - язык, зубы, губы - образует завихрения, создающие шум со сплошным спектром.

По способу образования согласные подразделяют на сонорные, щелевые, взрывные и аффрикаты. Сонорные (л, ль, р, рь, м, мь, н, нь) по звучанию похожи на гласные, но отдельно не произносятся и поэтому относятся к согласным. Щелевые (в, вь, з, зь, ж, ф, фь, с, сь, ш, х, хь) образуются в результате проталкивания потока воздуха в виде импульсов или шума через узкие щели, образованные языком и нёбом, губами, зубами, гор­танью. Взрывные (п, пь, т, ть, к, кь, б, бь, д, дь, г, гь) возникают в результате резкого открытия закрытого до этого рта. Аффрика­ты являются комбинацией глухих, взрывных и щелевых.

При произнесении звуков речи части речеобразующего тракта находятся для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляцией.

Звонкие звуки речи, особенно гласные, имеют большой уровень интенсивности звука, глухие - низкий. Уровень интенсивности особенно быстро меняется при произнесении взрыв­ных звуков. Динамический диапазон звуков речи составляет 35... 45 дБ. Длительность гласных звуков речи составляет 0,15... 0,3 с, согласных в среднем 0,08 с. Звук "п" длится примерно 30 мс. Большая протяженность гласных звуков вызвана необходимо­стью перестройки органов артикуляции.

Отметим, что звуки речи имеют различную информативную ценность. Гласные звуки менее информативны, чем со­гласные. Например, в слове "посылка" сочетание звуков о, ы, а ни о чем не свидетельствует, в то время как последователь­ность п, с, л, к дает почти однозначный ответ о смысле слова. Поэтому разборчивость речи снижается, главным образом, из-за маскировки шумами глухих звуков, имеющих меньшую интенсивность.

Перечисленные свойства звуков речи учитывают при проектировании и разработке устройств передачи, анализа и синте­за речи. Так для передачи смысла речи достаточно передавать сведения об огибающей спектра речи, переходах тон - шум, а также об изменениях основного тона. Для передачи эмоций не­обходим больший объем информации.