МИНИСТЕРСТВО КУЛЬТУРЫ РОССИЙСКОЙ ФЕДЕРАЦИИ
РОССИЙСКАЯ БИБЛИОТЕЧНАЯ АССОЦИАЦИЯ

РОССИЙСКИЙ КОММУНИКАТИВНЫЙ ФОРМАТ
ПРЕДСТАВЛЕНИЯ БИБЛИОГРАФИЧЕСКИХ ЗАПИСЕЙ В МАШИНОЧИТАЕМОЙ ФОРМЕ

Структура формата


3.1 Структура

Российский коммуникативный формат, как и UNIMARC, реализует библиографическую запись в машиночитаемой форме в структуре международного стандарта ISO 2709. Каждая библиографическая запись, подготовленная для обмена, должна содержать:

- МАРКЕР ЗАПИСИ, состоящий из 24-х символов;
- СПРАВОЧНИК, состоящий из 3-х цифровой метки для каждого поля данных, длины поля и позиции начального символа, относящегося к первому полю данных;
- ПОЛЯ ДАННЫХ переменной длины, отделенные друг от друга разделителем поля;

общая структура:

МАРКЕР ЗАПИСИСПРАВОЧНИКПЕРЕМЕННЫЕ ПОЛЯ%
% - Разделитель записи

В дальнейшем устанавливается, что данным в полях не обязательно предшествуют индикаторы, и они не обязательно подразделяются на подполя. Российский коммуникативный формат, как и UNIMARC, использует следующие положения, установленные Международным стандартом ISO 2709:

3.2 Маркер записи

ISO 2709 предписывает, что каждая запись начинается с 24-х символьного МАРКЕРА ЗАПИСИ. Он содержит данные, относящиеся к структуре записи, определения которых даются в стандарте ISO 2709, а также некоторые элементы данных, выделенные ISO 2709 для особого применения. Эти элементы данных, определяемые при применении, связаны с типом записи, ее библиографическим уровнем и положением в иерархии уровней, степенью полноты записи и использованием правил ISBD или других, основанных на ISBD правил подготовки записи. Элементы данных в МАРКЕРЕ ЗАПИСИ предназначены прежде всего для обработки записи и только косвенно для идентификации самих библиографических материалов.

3.3 Справочник

За Маркером записи следует СПРАВОЧНИК. Каждая статья справочника состоит из трех частей: 3х-цифровой метки, 4х-значного числа, указывающего длину поля данных, и 5ти-значного числа, указывающего начальную символьную позицию. Другие символы в статье справочника не допускаются.

СПРАВОЧНИК:

1-ая статья справочника   2-ая статья Другие статьи
МеткаДлина поляПозиция начального символа   ............... @
@ - Разделитель поля

Первая часть каждой статьи справочника - метка поля. Вторая часть статьи справочника определяет число символов в поле , на которое указывает метка, приведенная в первой части статьи. В это число включаются все символы - индикаторы, идентификаторы подполей, текстовые или кодированные данные и разделитель полей. Третья часть статьи справочника содержит позицию первого символа поля относительно позиции первого символа той части записи, которая содержит переменные поля. Первый символ первого переменного поля имеет символьную позицию 0. Положение символьной позиции 0 внутри целой записи задается позициями символов 12-16 Маркера записи.
Метка имеет длину - 3 символа, длина поля данных - 4 символа, позиция начального символа - 5 символов. После того, как 12-ти-символьные статьи справочника приведены в соответствие каждому полю записи, справочник заканчивается разделителем поля IS2 по ISO 646 (1/14 в 7ми-битной кодовой таблице). Иллюстрации Маркера и Справочника и их положения относительно полей данных - см. в Приложении К. Статьи справочника упорядочены по первой цифре метки. Рекомендуется при упорядочении использовать, где это возможно, метку целиком. Для самих полей данных определение порядка не является необходимым, так как их положение полностью определяется через справочник.

3.4 Переменные поля

Поля данных переменной длины следуют за справочником и содержат библиографические данные (в отличие от данных общей обработки, содержащихся в маркере).

Переменное (управляемое) поле (00):

Данные @

Переменное поле (от 01– до 999):

Индикаторы Идентификаторы подполя   Другие подполя
Инд.1Инд.2$a (и т. д.)ДанныеДанные.................. @

Метки не содержаться в полях данных, а приводятся только в справочнике. Исключение делается для меток во Встроенных полях (см. блок 4--). Поля с меткой 00- ( такие как 001) состоят только из данных и разделителя поля. Остальные поля данных состоят из двух индикаторов и следующим за ними любым количеством подполей. Каждое подполе начинается с идентификатора подполя, который состоит из разделителя подполя IS1 (1/15 по ISO 646) и кода подполя (буквенного или цифрового символа), идентифицирующего подполе. За идентификаторами подполя следуют кодированные или текстовые данные произвольной длины, не превышающей указанной в начале описания поля. Последним символом данных в записи обычно является символ конца записи IS3 (1/13 по ISO 646), следующий за символом конца поля IS2.

3.5 Обязательные поля

Набор обязательных в записи Российского коммуникативного формата полей соответствует списку обязательных полей UNIMARC:

001 ИДЕНТИФИКАТОР ЗАПИСИ
100 ДАННЫЕ ОБЩЕЙ ОБРАБОТКИ
101 ЯЗЫК ДОКУМЕНТА
200 ЗАГЛАВИЕ И СВЕДЕНИЯ ОБ ОТВЕТСТВЕННОСТИ (подполе $a обязательно для каждой записи)
801 ИСТОЧНИК ЗАПИСИ

3.6 Длина записей

Длина записи, которая ограничена в формате 99,999 символами, согласуется участниками обмена.

3.7 Связь записей

Российский коммуникативный формат, как и UNIMARC, предусматривает технику установления связи между записями. Для этих целей резервируется блок полей 4--. Более подробная информация приведена в описании этих полей и во введении к блоку 4--.
Связываемое поле включает библиографические данные, относящиеся к другому документу, с указанием или без указания информации об идентификаторе записи, в которой описан этот документ. Поле связи состоит из подполей, каждое из которых содержит метку, индикаторы, идентификаторы и содержание полей, включая идентификаторы подполей. Встроенные поля не доступны через Справочник, так как только целиком связанное поле имеет точку входа в Справочник.

3.8 Наборы символов

Для обмена данными в UNIMARC используются стандарты ISO на наборы символов. Маркер записи, справочник, индикаторы, идентификаторы подполя и кодовые обозначения, указанные в данном документе, должны кодироваться с использованием управляющих функций и графических символов по ISO 646 (IRV), которые рассматриваются как наборы по умолчанию для записи. Техника расширения кода, указанная в ISO 2022, используется, когда в записи требуется множество наборов. Позиции символов 26-29 и 30-33 подполя $a в поле 100 используются для определения наборов по умолчанию и дополнительных наборов графических символов, используемых в записи. Наборы символов должны быть зарегистрированы ISO, но также могут быть предметом договора между участниками обмена.

Во всех случаях используются следующие управляющие функции ISO 646, принятые для записи в UNIMARC:

IS1 по ISO 646 (позиция 1/15 7ми-битовой кодовой таблицы): первый символ двухсимвольного идентификатора подполя.
IS2 по ISO 646 (позиция 1/14 7ми-битовой кодовой таблицы): разделитель поля находится в конце справочника и каждого поля данных.
IS3 по ISO 646 (позиция 1/13 7ми-битовой кодовой таблицы): разделитель записи находится в конце каждой записи.

Когда необходимы дополнительные наборы символов, обычно используется управляющая функция ESC по ISO 646. Две управляющие функции по ISO 6630, используемые при сортировке, также допустимы в данных UNIMARC. Приложение J дает дополнительную информацию по наборам символов, использующимся в UNIMARC.

3.9 Повторение данных

Возможно четыре случая повторения данных в различных формах:

  • Данные появляются в кодированной и в текстовой форме, выводимые и не выводимые на экран дисплея. По возможности обе формы данных должны появляться в записи, даже если информация приводится в исходном формате лишь единожды.

  • Документ содержит одинаковую информацию на разных языках. ISBD устанавливает, когда и как параллельные данные каталогизируемого документа должны включаться в запись. Это реализовано в UNIMARC с использованием различных, в том числе повторяющихся, подполей. Примеры см. поле 200.

  • При каталогизации используется более чем один язык для многоязычных документов. Использование более одного языка при каталогизации (например, в полях примечаний) удобно, а в некоторых случаях обязательно в локальном формате. Записи UNIMARC подготавливаются на одном языке, поскольку агентства - пользователи, получая записи на нескольких языках, часто вынуждены исключать информацию на других языках, кроме своего "рабочего" языка. Допускается наличие отдельных записей на нескольких языках или формирование разноязычных обменных массивов на отдельных магнитных лентах.

  • Некоторая информация, повторяемая в различной графике, для представления вариантов сложных случаев вывода данных. В случае наличия каталогизационного описания на языке оригинала документа и в транслитерированной версии, в пункте 3.1 предложен механизм выбора пользователем устраивающего его варианта.

3.10 Альтернативная графика

Для альтернативных графических представлений в полях 001-099 и 200-899 используются те же определители содержания к соответствующим записываемым данным. Все поля формата будут считаться повторяемыми для записываемых альтернативных графических изображений или написаний вне зависимости, перечисляются они как повторяющиеся или нет в основной части текста. Поля, указанные как неповторяемые, должны использоваться не более одного раза для альтернативного графического изображения / написания, включенного в запись.

В каждое поле, повторенное для записи альтернативного графического изображения/графики, включаются подполе $6 (Связь между полями) и, если требуется, подполе $7 (Алфавит / графика поля). Особые инструкции по использованию подполей $6 и $7 следующие:

$6 Связь между полями

Подполе содержит информацию, позволяющую при обработке данных связать поле с другими полями в записи. Подполе также содержит код, указывающий на причину связи. При использовании подполя первые два элемента в подполе (позиции символов 0-2) должны присутствовать всегда, третий элемент (позиции символов 3-5) необязателен. Таким образом, длина этого подполя может быть 3 или 6 символов. Подполе $6, как правило, является первым подполем в поле и предшествует любому $7. Факультативное.
Не повторяется.

Данные, приводимые в подполе $6, записываются следующим образом:

Наименование элемента данныхКоличество символов Позиция символа
Код, объясняющий связь10
Номер связи21-2
Метка связываемого поля33-5

$6/0 Код, объясняющий связь

Код указывает причину установления связи между полями. Определены следующие значения:
a-альтернативное графическое изображение/графика
z-другая причина для связи

$6/1-2 Номер связи

Номер из двух цифр приводится в подполе $6 каждого из полей, связанных друг с другом. Его функция состоит в осуществлении подбора связываемых полей и не предназначена для установления последовательности или местонахождения номера. Номер связи может присваиваться произвольно, с условием, что будет идентичным в каждом из взаимосвязанных полей.

$6/3-5 Метка связываемого поля

Элемент состоит из 3х-символьной метки связываемого поля. Элемент является факультативным. Если метки для обоих связываемых полей идентичны, они обычно опускаются.

$7 Графика поля

Подполе содержит код для алфавита и/или графики основного содержания поля. Кодовые значения те же, что и для поля 100 позиции символов 34-35 Графика заглавия. Это подполе обычно опускается в полях с тем же алфавитом / графикой, коды которых приведены в позициях символов 34-35 поля 100.
Подполе должно размещаться в поле непосредственно перед первым подполем данных (например $a). Подполе $7 обычно следует за подполем $6, кроме тех случаев, когда отсутствует параллельное поле и, следовательно, подполе $6.
Факультативное.
Не повторяется.

Примеры

Пример 1.
600 #0$6a01$a[Персоналия в латинизированной форме]
600 #0$6a01$7ea$a[Персоналия в китайском написании]

Два параллельных поля, содержащих латинскую и китайскую формы имени лица, деятельность которого является предметом описания определенного материала. Первое поле не имеет $7, так как значение его в том же алфавите, что используется при кодировании позиций символов 34-35 поля 100, то есть "ba" (латинский).

Пример 2.
200 1#$6a01$a[Заглавие в корейских символах]
200 1#$6a01$7ba$a[Заглавие латинизировано]

Два поля параллельных заглавий, содержащее корейскую и латинскую версии заглавий. Первое поле не имеет $7, так как значение его в том же алфавите, что используется при кодировании позиций символов 34-35 поля 100, то есть "ka" (корейский).

Пример 3.
701 #0$6a04$a[Первый соавтор, записанный в канджи]
701 #0$6a04$7dc$a[Первый соавтор, записанный в кана]
701 #0$6a04$7ba$a[Первый соавтор, записанный в латинизированной форме]
701 #0$6a08$a[Второй соавтор, записанный в канджи]
701 #0$6a08$7dc$a[Второй соавтор, записанный в кана]
701 #0$6a08$7ba$a[Второй соавтор, записанный в латинизированной форме]

Поля добавочных описаний для отражения в японских азбуках канджи, кана и в латинизированной форме, имеющихся авторов. Поля, записанные в канджи, не содержат подполя $7, так как позиции символов 34-35 поля 100 содержат "db'' (японская азбука канджи).

[ Содержание ]


RusmarcServ@nlr.ru
© National Library of Russia, 1997