logo
LEKZII

Принципы хранения информации в компьютере

Вся информация в компьютере хранится на внешних несъемных или сменных носителях. Обычно это накопители на магнитных, оптических и магнитооптических дисках. Как можно найти любого человека по адресу его проживания, так можно найти любую информацию на дисках компьютера, используя для этого специально созданную адресную структуру хранения – файловую систему ОС. Каждая операционная система имеет свою файловую систему.

Внешние накопители на дисках, как и любые устройства компьютера, имеют свои физические номера. Так, активный жесткий магнитный диск, с которого загружается операционная система, всегда имеет номер 80h. На логическом же уровне пользователю удобнее работать с именами, поэтому накопителям на дисках присваиваются имена в виде букв латинского алфавита с двоеточием. Принято дисководы съемных магнитных дисков (дискет) обозначать именами А: и В:. Жестким несъемным дискам (винчестерам) присваивают имена, начиная с имени С:. Часто общее физическое пространство винчестера с помощью специальных программ делят на отдельные области – разделы. Это аналогично строительству складов на площади, до того лишь отведенной под них. В зависимости от назначения разделы могут быть основными (primary) и дополнительными (extended), а также активными (active), системными (system) и загрузочными (boot). Деление жесткого диска на разделы может быть вызвано одной из следующих причин:

Каждую такую область физического диска оформляют в виде логического диска (диска физически не существующего, а фиктивно созданного программным путем). Этим логическим дискам присваивают имена в виде букв, следующих за С:, то есть D:, E:, F:, G:,H: и т.д. Чтобы обратиться к тому или иному диску для записи или чтения информации, необходимо указать его имя (как при обращении к человеку). Диск, с которым в данный момент работает пользователь, называется текущим, или активным. Имя диска – высший уровень в системе адресации.

Информация на дисках записывается в файлы. Файл – это выделенная на диске или другом носителе область, имеющая имя. Имя файлу присваивает пользователь произвольно – по своему усмотрению. Как люди общаются между собой по именам, так и программы в компьютере обращаются к тому или иному файлу по имени. В файле может храниться различная однотипная информация. Это может быть графическое изображение или текст какого-либо документа, массив числовых данных или программа в машинных кодах, таблица расчета рентабельности предприятия или музыкальный сюжет. В последнее время появились файлы типа мультимедиа. В таком файле вперемешку хранится разнородная информация, например, видеокадры, музыкальные сюжеты и текст. Файл является еще одним уровнем системы адресации.

Файлы, относящиеся к какой-то проблеме или предназначенные для выполнения какой-то определенной работы, группируются и их имена и характеристики регистрируются в специальных таблицах или других структурах на диске – оглавлениях файлов – каталогах, или директориях. Создаваемые пользователями каталоги являются своеобразными файлами, поэтому им также присваивают имена и регистрируют в других каталогах. Имена им задает пользователь по своему усмотрению, но так, чтобы можно было по имени определить, какие файлы содержит данный каталог. Это будет третий из уровней системы адресации.

Таким образом, чтобы записать какой-то документ или программу на диск, необходимо, как почтовый адрес, указать путь: имя диска – имя каталога – имя файла, в который будет записываться информация. Аналогично и при чтении информации с диска.

Файлы.

Присвоение имен файлам и каталогам хотя и производится пользователем произвольно, однако зависит от используемой операционной системы. В MS-DOS и Windows 3.хх имена можно задавать, используя алфавит только латинского языка, причем длина имени не должна превышать восьми символов. Не разрешается в именах использовать символ пробела и знаки + : > ; “ < =. Строчные и прописные буквы воспринимаются одинаково.

Для того, чтобы подчеркнуть характер хранимой информации, файлу обычно присваивают тип или расширение имени. Присвоение типа осуществляет автоматически программа, в которой создавался файл. Тип или расширение файла может содержать не более трех символов из тех, что используются для имен и записывается вслед за именем через точку. Пробел после точки не допускается. Тип не обязателен и может отсутствовать. По типу файла легко определить его принадлежность. Например, PROG.PAS – легко догадаться, что файл с именем PROG хранит текст программы, написанный на языке программирования Паскаль. Часто имя файла и его расширение объединяют в одно понятие – полное имя файла. Примеры допустимых имен: START.BAT, MYFILE.DOC, GOD1995.TXT, P1.C, 123.BAS, HELP, PLAY_R.WAV. Примеры недопустимых имен файлов: 2>1.TXT (знак >), NINA+K (знак +), FORM 3.TXT (пробел перед цифрой 3), ОТЧЕТ. 98 (русские буквы).

Некоторые сочетания символов нельзя использовать в качестве имен файлов, так как операционная система резервирует их для обозначения системных устройств. К ним относятся:

PRN – имя принтера;

LPT1-LPT4 – устройства, подключаемые к параллельным портам 1-4;

CON – при вводе информации – это клавиатура, а при выводе – экран;

СOM1-COM4 – устройства, подключаемые к последовательным портам;

AUX – синоним порта СОМ1;

NUL – “пустое” устройство. Для него все операции ввода–вывода игнорируются, но программе сообщается, что ввод – вывод произошел успешно.

Файлы с такими именами операционная система просто не зарегистрирует. Иногда бывает очень удобно использовать имена системных устройств. Например, командой COPY легко можно вывести файл на принтер COPY PAP.TXT PRN или на экран COPY PAP.TXT CON, можно создать на диске файл с клавиатуры: COPY CON PAP.TXT. Вместе с тем, эти имена допустимы в качестве расширений файлов, например: TEST.PRN, 1A.CON. При создании файла или изменении его содержимого автоматически регистрируются дата и время по показаниям календаря и часов системы. Имя, тип, размер в байтах, дата и время создания файла фиксируются в каталоге и являются его характеристиками.

Во многих командах (копировать, удалить, распечатать и др.) для указания сразу нескольких файлов из одного каталога используются шаблоны, или обобщающие символы * и ?. Знак * обозначает любые допустимые для имен и расширений файлов символы, а знак ? обозначает любой одиночный символ. Примеры шаблонов:

I*.XLS – все файлы типа XLS, имеющие имена с буквы I;

*.ЕХЕ – все файлы с расширением ЕХЕ;

*.??? – все файлы;

Р???.* – все файлы, имеющие имена с буквы Р не более 4-х символов.

Группу файлов из разных каталогов выделить нельзя.

Некоторые расширения имен файлов стандартизированы. Все файлы исполняемых программ имеют тип .СОМ или .ЕХЕ, файлы с расширением .ВАК содержат старые копии данных (такие файлы создают многие программы перед изменением их содержимого на случай ошибки, чтобы можно было восстановить хотя бы старую копию), расширение .ВАТ имеют так называемые командные файлы. Все инструментальные системы, а также и многие программы при создании текстов присваивают свои расширения файлам, хранящим эти тексты: .BAS – язык программирования Бейсик, .С – язык программирования Си, .PRG – многие системы управления базами данных, .PAS – язык программирования Паскаль, .DOC – текстовый редактор Word, .XLS – табличный процессор Excel и т.д.

Файлам всегда присваиваются атрибуты (признаки): “только для чтения” (R/O-read only), “скрытый” (Hid-hidden), “системный” (Sys-system), “архивный” (Arc-archive). Файлу может быть установлен один или несколько атрибутов одновременно. Назначение их таково:

Ограничение длины имени файлов не очень удобно. Сокращенное имя, да еще из латинских символов быстро забывается. Пользователю приходится выводить файл на экран, чтобы посмотреть, что он содержит. В современных операционных системах Windows 95 и выше, OS/2 и Windows NT файлам и каталогам, наряду с короткими, разрешается присваивать имена длиной до 254 символов. Кроме допустимых в MS-DOS, можно использовать символы русского алфавита, пробелы, символы + , ; = . [ ]. Это позволяет файлам присваивать наглядные и понятные имена. Прописные и строчные буквы в таких именах файлов должны различаться, что обеспечивает удобочитаемость. Однако в одном и том же каталоге файлы с одинаковыми именами, отличающимися только регистром букв, недопустимы – они просто не будут зарегистрированы.. Примеры:

Реферат на тему: Реформы Петра I.doc

1234.5678.97531.dat

Отчет по лабораторной работе № 6 по физике.txt

Не рекомендуется длинные имена задавать более 6070 символов, так как в них неудобно ориентироваться. Имя файла вместе с указанным путем доступа к нему (спецификацией) не должно составлять более 260 символов, иначе файл, помещенный в глубоко вложенный каталог, некоторыми программами не будет найден. Наконец, если имя такого файла зарегистрировано в корневом каталоге, то оно резко сокращает его объем. При задании длинного имени файлу автоматически генерируется и записывается короткое имя для того, чтобы обеспечить возможность использования файла и при работе в MS-DOS.

Каталоги.

При интенсивной работе на компьютере число файлов быстро растет, и “следить за порядком” на диске становится все сложнее. Структурировать и упорядочить дисковое пространство позволяют каталоги файлов. Каталоги представляют собой простые таблицы или более сложные структуры в виде деревьев (Windows NT), то есть по-существу это тоже файлы. В MS-DOS каталог представляет таблицу, состоящую из строк по 32 байта каждая. Такая же структура каталогов создается на дискетах, независимо от операционной системы, а также во всех Windows, кроме Windows NT. В одной строке (позиции) может быть зарегистрирован один файл или каталог пользователя, который регистрируется как обыкновенный файл. Каталог напоминает районный паспортный стол, где каждый из нас (файлов) имеет регистрационную карточку (позицию каталога) с данными о проживании. При подготовке диска к работе (форматировании) создается главный, или корневой каталог – основа адресной структуры системы. Имя этого каталога состоит из одного символа \ и присваивается программой форматирования автоматически. Принципиальное отличие корневого каталога от пользовательских состоит в том, что данные о нем нигде не зарегистрированы, как об остальных каталогах (просто нет над ним структуры, где бы он мог зарегистрироваться). А раз нет о нем информации, то изменить имя корневого каталога или удалить каталог с диска невозможно. В отличие от каталога, создаваемого пользователем, который может занимать все дисковое пространство, количество позиций в корневом каталоге ограничено и зависит от объема диска. После форматирования все позиции корневого каталога пустые, так как при форматировании вся информация на диске уничтожается. По мере записи информации на диск, позиции занимаются информацией о файлах или пользовательских каталогах. На рис. 21 приведен фрагмент корневого каталога системного диска в MS-DOS, выведенный на экран в виде, формируемом утилитой Нортона NU.EXE:

Sector 171 in root directory Offset 0, hex 0

Attributes

Filename Ext Size Date Time Cluster Arc R/O Sys Hid Dir Vol

-------- --- --------- -------- -------- ------- --------------------------------------------

VICTOR 6/01/99 18:54 Vol

IO SYS 40774 19/08/94 12:00 281 Arc R/O Sys Hid

MSDOS SYS 38138 19/08/94 12:00 318 Arc R/O Sys Hid

DRV 6/01/99 22:21 8361 Dir

DOS 17/09/98 18:22 149 Dir

ARC 6/01/99 22:26 905 Dir

AUTOEXEC BAT 496 28/01/99 15:19 92 Arc

QPRO 17/09/98 18:23 2662 Dir

PASCAL 17/01/99 6:33 9844 Dir

COMMAND COM 54869 19/08/94 12:00 1525 Arc R/O Hid

NC 6/01/99 20:40 254 Dir

CONFIG SYS 143 28/01/99 15:20 94 Arc

хATR PAS 47 24/12/98 11:37 2680 Arc

Рис. 21

Из рисунка видно, что при регистрации файла в каталоге записываются его имя, тип, размер в байтах, дата и время создания, номер кластера (участок диска), начиная с которого записывается файл и атрибуты файла. Каталоги, созданные пользователем, имеют метку Dir. Они аналогичны файлам и по количеству позиций ограничены только объемом диска. Пользовательские каталоги являются подчиненными тому каталогу, в котором они зарегистрированы, поэтому называются подкаталогами. Каталог, в котором зарегистрирован подкаталог, является для него родительским. Каждый пользовательский каталог может включать в себя еще подкаталоги. При записи пути к файлу каталоги отделяются друг от друга обратной косой чертой (\). Так образуется иерархическая, древовидная файловая система диска. При удалении файла или каталога с диска первый символ его имени в каталоге заменяется строчной русской буквой х (с кодом 229), сообщающей всем программам, что к файлу доступа нет – он удален. В Windows NT при удалении файла из каталога удаляется его длина. Физически же он сохраняется до тех пор, пока на это место не будет что-то записано вновь, (см. последний файл на рис.21). Это позволяет специальным программам восстановить файл или каталог, если они были удалены случайно.

Каталог, с которым в настоящий момент работает пользователь, называется текущим, или активным. Для доступа к файлу, зарегистрированному в текущем каталоге, указывать путь не требуется. Для того, чтобы посмотреть, какие файлы и подкаталоги зарегистрированы в каталоге, необходимо его раскрыть – вывести на экран оглавление.

Если при форматировании диска ему была присвоена метка тома (Vol), то она также регистрируется в каталоге. При этом в позиции каталога записывается: в поле имени файла – имя (метка), дата и время создания метки и признак метки Vol (см. первую позицию каталога на рис. 21).

Фактическое расположение информации в строке каталога показано на рис. 22. Именно признаки Vol, Hid, Sys и R/O (0Fh – см. рис. 22) байта атрибутов позиции каталога используются в Windows 9х для задания длинных имен файлов и каталогов. Оказывается, что практически все прикладные программы "не видят" позиции каталогов с совокупностью этих меток. Поэтому, чтобы не создавать новую файловую систему, было решено записывать длинные имена файлов и каталогов и информацию, связанную с ними, в элементы каталога рядом с коротким именем, ставя в них признаки Vol, Hid, Sys и R/O.

Рис. 22

Таким образом, на диске совершенно четко и однозначно указывается местоположение любой информации, как почтовый адрес для людей. Например, программа текстового редактора, с помощью которого формировался текст лекций этого сборника, расположена по следующему адресу: D:\Program Files\Microsoft Office\Office10\WinWord.exe. В операционных системах Windows 95 и выше, Windows NT, OS/2 каталоги называются папками. Более подробно файловая структура на диске изучается на практических занятиях при работе на компьютере в лаборатории.

Лекция 20