Улучшение качества услуг, передаваемых в сетях с коммутацией пакетов

дипломная работа

1.6 Обработка речи в IP-телефонии, необходимая для обеспечения качественной передачи

Для обеспечения качества услуг, предоставляемых в сетях с коммутацией пакетов в первую очередь необходимо применение качественного оборудования, которое позволит успешно решать задачи установления, модификации и завершения телефонных соединений, включая процессы межсетевого взаимодействия, управления безопасностью вызова, запроса качества обслуживания, шифрования, аутентификации и другие. В рекомендации Н.323 описаны четыре основных устройства, используемые для качественной передачи по IP-сетям, показанные на рисунке 1.10.

Рисунок 1.10 - Зона Н.323

Терминалы Н.323 представляют собой конечную точку в сети, способную передавать и принимать трафик в масштабе реального времени, взаимодействуя с другими терминалами Н.323, шлюзом или устройством многоточечной конференции (MCU - Multipoint Control Unit). Н.323-терминал должен поддерживать протоколы Н.245,Q.931, RAS, RTP/RTCP и семейство протоколов Н.450, а также включать в себя аудиокодек G.711. Примером терминала, поддерживающего стандарт Н.323 являются аппараты фирмы Selsius Systems и компании Cisco Sistems. Они выглядят как системные телефоны, только оснащенные интерфейсом Ethernet вместо порта RJ-11. Такие терминалы, используя собственные процессоры, микропрограммные кодеки и стек TCP/IP, обеспечивают высокое качество звука и уровень надежности.

Шлюз IP-телефонии обеспечивает сжатие информации (голоса), конвертирование ее в IP-пакеты и направление в IP-сеть. С противоположной стороны шлюз осуществляет обратные действия: расшифровку и расформирование пакетов вызовов. В результате обычные телефонные аппараты без проблем принимают эти вызовы. Большая часть функций IР-шлюза в рамках архитектуры TCP/IP реализуется в процессах прикладного уровня. В Казахстане в основном в IP-телефонии используются IP-шлюзы Н.323 фирмы Cisco следующей емкости:

Cisco 3620 c одним модулем NM-HDV-2E1-60E, в зависимости от выбранного типа сложности кодеков - от 30 до 60 голосовых портов;

Cisco 3640 с тремя модулями NM-HDV-2E1-60E, в зависимости от выбранного типа кодеков - от 90 до 180 голосовых портов;

Cisco 3660 содержит на шасси встроенный порт Ethernet и благодаря этому имеет возможность установить шесть модулей NM-HDV-2E1-60E, что в зависимости от выбранного типа кодеков, позволяет получить от 180 до 360 голосовых портов.

А также используется продукт компании 3Com Corp. - PathBuilder S200 Voice Access Switch - представляющий собой маршрутизатор, коммутатор доступа и шлюз в едином исполнении. Допускает подключение до 28 речевых каналов. Поддерживает аналоговые телефонные интерфейсы FXS, FXO, E&M и цифровые Е и PRI-ISDN. Важным достоинством является возможность передачи речи через сети Frame Relay. Поддерживает стандарт Н.323 и, соответственно, алгоритмы кодирования голоса G.711, G.723.1 и G.729а. При этом достигается компрессия голоса до 5,3кбит/с. Положение шлюзов в сети показано на рисунке 1.11, а обработка сигнала - на рисунке 1.12.

Рисунок 1.11 - Положение шлюза в сети с коммутацией пакетов

Рисунок 1.12 - Схема обработки сигналов в шлюзе

Наличие разноплановых функций с вычислительной точки зрения функций, выполняемых системой, порождает проблему ее программной и аппаратной реализации. Рациональное решение этой проблемы основано на использовании распределенной системы, в которой управленческие задачи и связь с сетью осуществляется с помощью универсального процессора, а решения задач сигнальной обработки и телефонного интерфейса выполняются на цифровом процессоре обработки сигналов.

Телефонный сигнал с двухпроводной абонентской линии поступает на дифференциальную систему, которая разделяет приемную и передающую части канала. Далее сигнал передачи вместе с «просочившейся» частью сигнала приема подается на аналогово-цифровой преобразователь (ADC) и превращается либо в стандартный двенадцати разрядный сигнал, либо в восьмиразрядный сигнал, закодированный по м- или А-закону. В последнем случае обработка должна также включать соответствующий экспандер. В устройстве эхокомпенсации (Echo canceller) из сигнала передачи удаляются остатки принимаемого сигнала. Эхокомпенсатор представляет собой адаптивный нерекурсивный фильтр, длина памяти (порядок) которого и механизм адаптации выбираются таким образом, чтобы удовлетворить требованиям МСЭ-Т G.165. Для обнаружения и определения сигналов внутриполосной многочастотной телефонной сигнализации (MF сигналов), сигналов частотного (DTMF) или импульсного наборов используются детекторы соответствующих типов. Дальнейшая обработка входного сигнала происходит в речевом кодере (Speech Coder). В анализаторе кодера сигнал сегментируется на отдельные фрагменты определенной длительности (в зависимости от метода кодировании) и каждому входному блоку присваивается информационный кадр соответствующей длины.

Часть параметров, вычисленная в анализаторе кодера, используется в блоке определения голосовой активности (VAD - Voice Activity Detector), который решает, является ли текущий анализируемый фрагмент сигнала речью или паузой. При наличии паузы информационный кадр может не передаваться в службу виртуального канала. На сеансовый уровень передается лишь каждый пятый «паузный» информационный кадр. Кроме того, при отсутствии речи для кодировки текущих спектральных параметров используется более короткий информационный кадр. На приемной стороне из виртуального канала в логический поступает либо информационный кадр, либо флаг наличия паузы. На паузных кадрах вместо речевого синтезатора включается генератор комфортного шума (Noise Generator), который восстанавливает спектральный состав паузного сигнала. Параметры генератора обновляются при получении паузного информационного кадра. Наличие информационного кадра включает речевой декодер, на выходе которого формируется речевой сигнал. Для эхокомпенсатора этот сигнал является сигналом дальнего абонента, фильтрация которого дает составляющую электрического эха в передаваемом сигнале. В зависимости от типа цифро-аналогового преобразования (DAC) сигнал может быть подвергнут дополнительной кодировке по А- или м-закону.

Можно выделить следующие основные проблемы цифровой обработки сигналов в шлюзе.

При использовании двухпроводной абонентской линии актуальной остается задача эхокомпенсации, особенность которой состоит в том, что компенсировать необходимо два различных класса сигналов - речи и телефонной сигнализации. Очень важной является задача обнаружения и детектирования телефонной сигнализации. Ее сложность состоит в том, что служебные сигналы могут перемешиваться с сигналами речи.

С построением кодеков тесно связана задача синтеза VAD. Основная трудность состоит в правильном детектировании пауз речи на фоне достаточно интенсивного акустического шума (шум офиса, улицы, автомобиля и т.д.).

Gatekeeper (контроллер зоны) выполняет функции управления вызовами, а также:

преобразовывает адреса-псевдонимы в транспортные адреса;

контролирует доступ в сеть на основании авторизации вызовов, наличия необходимой для связи полосы частот и других критериев, определяемых производителем;

контролирует полосу частот;

управляет зонами.

Сервер управления конференциями (MCU) обеспечивает связь трех и более Н.323-терминалов. Сервер управляет ресурсами конференции, согласовывает возможности терминалов по обработке звука и видео, определяет аудио- и видеопотоки, которые необходимо направлять по многим адресам.

Также для обеспечения качественной передачи речевых сигналов в IP-телефонии необходима их следующая обработка:

а) устранение всех нежелательных компонентов из входного аудиосигнала. После оцифровки речи необходимо удалить эхо из динамика в микрофон, комнатное эхо и непрерывный фоновый шум (например, шум от вентиляторов), а также отфильтровать шумы переменного тока на низких частотах звукового спектра.

Эффективное эхоподавление и уменьшение шумов абсолютно необходимо в любой конфигурации с «открытым микрофоном» и с громкоговорителем на базе персонального компьютера (ПК) для традиционной и IP-телефонии. Эти функции все в большей мере реализуются аудиокомпонентами ПК, так что сама система IP-телефонии может их и не иметь. Шлюзам IP-телефонии требуется выполнять меньший объем предварительной обработки, нежели конечным решениям, потому что УАТС и телефонная сеть обеспечивают фильтрацию и уменьшение шумов;

б) подавление пауз в речи; распознавание остаточного фонового шума (внешних шумов) и кодирование для восстановления на дальнем конце; то же самое для опознаваемых сигналов. Паузы лучше всего полностью подавлять на ближнем конце. Для сохранения окружающих звуков необходимо смоделировать фоновые шумы, чтобы система на дальнем конце могла восстановить их для слушателя. Сигналы многочастотного набора номера DTMF и другие сигналы можно заменить на короткие коды для восстановления на дальнем конце (или для непосредственной обработки). Возможные проблемы: из-за того, что функция подавления пауз активизируется, когда громкость речи становится ниже определенного порога, некоторые системы обрезают начала и концы слов (в периоды нарастания и снижения энергии речи);

в) сжатие голосовых данных. Сжать оцифрованный голос можно разными способами. В идеале решения, используемые для IP-телефонии, должны быть достаточно быстрыми и давать на выходе небольшие массивы данных;

г) «нарезание» сжатых голосовых данных на короткие сегменты равной длины, их нумерация по порядку, добавление заголовков пакетов и передача. Хотя стек протоколов TCP/IP поддерживает пакеты переменной длины, их использование затрудняет достижение устойчивой и предсказуемой межсетевой маршрутизации в голосовых приложениях. Маршрутизаторы быстро обрабатывают небольшие пакеты и рассматривают обычно все передаваемые по одному и тому же IP-адресу пакеты одного размера одинаковым образом. В результате пакеты проходят по одному маршруту, поэтому их не надо переупорядочивать;

д) прием и переупорядочивание пакетов в адаптивном «буфере ресинхронизации» для обеспечения интеллектуальной обработки потерь или задержек пакетов. Главной целью здесь является преодоление влияния переменной задержки между пакетами. Решение данной проблемы состоит в буферизации достаточного числа поступающих пакетов (при отложенном их воспроизведении) с тем, чтобы воспроизведение было непрерывным, даже если время между поступлением пакетов сильно различается. Лучшие продукты для IP-телефонии моделируют производительность сети и регулируют размер буфера ресинхронизации соответствующим образом - уменьшая его (сокращая задержку перед воспроизведением), когда сеть ведет себя предсказуемым образом, и увеличивая в противоположной ситуации.

Делись добром ;)