logo search
make

1.2 Характеристика источника речевого сигнала

Рассмотрим основные показатели, характеризующие источник сигнала в случае, когда информационным сигналом является речевой сигнал ― сложный амплитудно и частотно модулированный шумовой процесс:

Импульсы потока воздуха, создаваемые голосовыми связками, могут считаться периодическими — величина, обратная периоду повторения импульсов называется частотой основного тона голоса. Частота основного тона для всех типов голосов (бас, тенор и др.) лежит в интервале 70–450 Гц. Она играет существенную роль при опознавании говорящего (наряду с интонацией — изменением частоты основного тона, тембром ― определяется величиной и количеством гармоник речевого спектра), но слабо влияет на показатели распознавания звуков речи.

Частотный диапазон речи заключен в пределах 70–7000 Гц. Области спектра, в которых сосредоточена основная мощность речевого акустического сигнала, называются формантами; нулевые значения ― антиформантами. Основная энергия большинства формант (форманты отвечают за различение звуков речи) сосредоточена в диапазоне частот 300–3400 Гц, что позволяет ограничивать спектр речевого сигнала без существенной потери его разборчивости этой частотой. Можно заметить, что при распространении речевого сигнала через различные ограждения в первую очередь поглощаются высокочастотные составляющие спектра речи, отвечающие за определение индивидуальности говорящего, но смысл речевого сообщения остается понятным.

Интенсивность излучения — физическая характеристика акустического сигнала ― энергия акустической волны, прошедшая за 1 с перпендикулярно поверхности площадью 1 м2. Интенсивность речевого акустического сигнала во время речеобразования непрерывно меняется, поэтому интенсивность речи характеризуется средним уровнем интенсивности речи и средним спектральным уровнем речи ― средним уровнем энергии, приходящейся на полосу шириной 1 Гц. Пикфактором речи называют разность между максимальным значением речевого сигнала и его средним уровнем.

Громкость звука, представляющая собой взвешенную по частоте интенсивность звука и измеряемая как десятичный логарифм отношения интенсивности звука к порогу слышимости, является физиологической характеристикой акустического сигнала, учитывающей зависимость чувствительности слуховой системы человека от частоты акустической волны.

Поскольку основным источником речевой информации является человек, то средняя громкость сигналов акустических каналов утечки информации находится в пределах 40–80 дБ.

Звуки речи неодинаково информативны. Гласные звуки несут меньшую информацию о смысле речи, чем глухие (хотя в отличие от глухих имеют высокий уровень интенсивности). Подтверждением этого является тот факт, что текст, из которого удалены все гласные, вполне читабелен, в отличие от текста, из которого удалены все согласные. Поэтому разборчивость речи сильно снижается при действии низкочастотных шумов, маскирующих глухие звуки. Кроме того, в силу психофизиологических особенностей восприятия звука человеком, маскирующий звук оказывает незначительное влияние на тоны речи ниже его собственной частоты, но сильно затрудняет восприятие более высоких звуков. Рассмотренные выше эффекты являются основой такого метода противодействия подслушиванию как энергетическое сокрытие речевого сигнала путем зашумления.

Динамический диапазон сигнала характеризуется значением десятичного логарифма отношения максимальной мощности сигнала к минимальной. Для речевого сигнала информативность данной характеристики источника не слишком существенна, поскольку смысл речевого сообщения понятен даже при симметричном относительно нуля ограничении аналогового речевого сигнала и преобразовании его в двоичную последовательность (клипированная речь) [11].

В данном параграфе характеристики источника речевой информации приведены с позиции их значения при утечке информации. В качестве информационного критерия используется разборчивость речи ― процентное количество правильно воспринятых слушателями элементов речи из общего количества произнесенных. Элементами речи являются звуки, слоги, слова, фразы, соответственно которым различают звуковую, слоговую, словесную, смысловую разборчивость речи.

Разборчивость речи считается отличной, если слоговая разборчивость превосходит 85%. Неудовлетворительной разборчивости речи (около 40% слоговой разборчивости) соответствует примерно 90% разборчивости фраз. Подслушивание считается невозможным, если словесная разборчивость речи меньше 20% (в случае зашумления «белым шумом») [12].