logo search
Виды связей

Кодирование речи

Для передачи голоса по IP-сети, человеческий голос оцифровывается (АЦП) при помощи импульсно-кодовой модуляции, сжимается (кодируется) и разбивается на пакеты. На принимающей стороне, происходит обратная процедура - данные извлекаются из пакетов, декодируются и преобразуются обратно в аналоговый сигнал (ЦАП).

Кодирование вносит дополнительную задержку порядка 15—45 мс, возникающую по следующим причинам:

Подобная задержка появляется и при декодировании речи на другой стороне.

Задержку кодека необходимо учитывать при расчёте сквозных задержек (см. выше). Кроме того, сложные алгоритмы кодирования/декодирования требуют более серьёзных затрат вычислительных ресурсов системы.

Проведённый в различных исследовательских группах анализ качества передачи речевых данных через Интернет показывает, что основным источником возникновения искажений, снижения качества и разборчивости синтезированной речи является прерывание потока речевых данных, вызванное:

Это требует решения задачи оптимизации задержек в сети и создание алгоритмов компрессии речи, устойчивых к потерям пакетов (восстановления потерянных пакетов).

Кодеки

Применяемые алгоритмы сжатия голоса при передаче по IP-сети довольно разнообразны. Некоторые практически не сжимают голос, оставляя его на уровне импульсно-кодовой модуляции (т.е. 64 килобит в секунду), другие кодеки позволяют сжимать цифровой голосовой поток в 8 и более раз за счёт эффективных алгоритмов кодирования. Существует немало хороших свободных кодеков, использование которых не требует лицензирования. Для других же требуется достижения соответствующей лицензионной сертификации между производителем оборудования (программного обеспечения) и авторами метода сжатия.

Открытые:

  • GSM

  • G.711 μ-law

  • G.711 a-Law

  • G.722

  • G.726

  • Speex

  • iLBC

Проприетарные:

  • G.729

  • G.729A

  • G.723

  • G.723.1

Сравнительные характеристики VoIP-кодеков[4]

Кодек

Полезная нагрузка пакета, байт

Скорость передачи, кбит/с

Алгоритмическая задержка, миллисекунд

Занимаемый поток, кбит/с

IP-пакеты

Ethernet-фреймы

G.711

160

64

20

64,8

80

G.723.1 (6.3)

24

6,3

37,5

6,9

17,1

G.723.1 (5.3)

20

5,3

37,5

5,9

16

G.726-32

160

32

20

32,8

42,7

G.726-24

160

24

20

24,8

34,7

G.726-16

160

16

20

16,8

26,7

G.729 (8)

20

8

25

8,8

18,7

G.729 (6.4)

16

6,4

25

7,2

17,1