logo search
Лекции по информатике

2.Меры информации.

Информационные меры можно рассмотреть в трех аспектах: синтаксическом, семантическом и прагматическом.

1.Синтаксическая мера информации: эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Объем данных (VД) измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных: в двоичной системе счисления единица измерения бит (bitbinary digit – двоичный разряд); в десятичной системе счисления единица измерения – дит (десятичный разряд).

ПРИМЕР. Сообщение в двоичной системе в виде 8-ми разрядного двоичного кода 10110111 имеет объем данных VД= 8 бит.

Сообщение в десятичной системе в виде 6-ти разрядного числа 451231 имеет объем 6 дит.

Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Получение информации о какой-либо системе всегда связано с измерением степени неосведомленности получателя о состоянии этой системы. Рассмотрим это понятие.

Энтропияобщее количество незнания.

Количество информации, уменьшающее неопределенность в 2 раза равно 1 биту.

ПРИМЕР: При падении монеты мы не знаем, с какой стороны она упадет. После падения неопределенность уменьшается в 2 раза.

В 1928 году Р. Хартли предложил такую формулу измерения количества информации.

N=2I

где I –количество информации, а N – количество равновероятных событий, которые ожидаются при проведении эксперимента.

Эта формула в 1948 году была расширена К. Шенноном на случай неравновероятных событий.

I=-pklog2pk

где N – количество возможных исходов, p – вероятность наступления k-того события, I – количество информации.

2. Семантическая мера информации. Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне большое признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.

Тезаурус – это совокупность сведений, которыми располагает пользователь или система.

В зависимости от отношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Iс, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Максимальное количество семантической информации Ic пользователь приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp когда информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе сведения).

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремится к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему.