На главную  |  Полнотекстовый поиск  |  Сайт ГПНТБ России  |  Оформление подписки  |  Архив  |  Раздел для подписчиков

Научные и технические библиотеки №11 2013 год
Содержание:

Шрайберг Я. Л. Электронная книга, будущее библиотеки и общественное сознание: попытка осмысления и предвидения. Ежегодный доклад Конференции «Крым». Год 2013

ФОНДЫ БИБЛИОТЕК: ПРОБЛЕМЫ И РЕШЕНИЯ

Шилов В. В., Тихонова Н. О., Хомякова Н. М. Современное состояние «иностранного книжного фонда» Российской национальной библиотеки. (Итоги статистического анализа)

МЕЖДУНАРОДНЫЕ БИБЛИОТЕЧНЫЕ ДОКУМЕНТЫ

Бахтурина Т. А. Понятие «пространство имён» (namespase) и сферы его применения. Пространства имён ISBD

ОБЗОРЫ. РЕЦЕНЗИИ

Столяров Ю. Н. От термина «документированная информация» пора отказаться

ИНФОРМАЦИОННЫЕ СООБЩЕНИЯ

Сукиасян Э. Р. Важный шаг в понимании Информатики. (Итоги 13-го заседания Семинара в ИНИОН РАН)

Письмо в редакцию. Об авторском праве и нормах этики

Ответы на вопросы, прозвучавшие в игре «Что? Где? Когда? в библиотечно-информационном, книжном и издательском пространстве» на 20-й Юбилейной Международной конференции «Крым»

Памяти А. И. Чёрного


МЕЖДУНАРОДНЫЕ БИБЛИОТЕЧНЫЕ ДОКУМЕНТЫ

УДК 025.32

Т. А. Бахтурина

Понятие «пространство имён» (namespace)
и сферы его применения.
Пространства имён ISBD

Рассмотрено новое явление в международных библиотечных документах – «пространство имён», охарактеризованы «родная» сфера его применения – XML – и сферы заимствования – пространства имён IFLA, FRBR, ISBD. Сделан акцент на терминологии и документах, регламентирующих пространства имён в конкретных сферах.

Ключевые слова: пространство имён, XML, IFLA, FRBR, ISBD, терминология, Открытый реестр метаданных.

Библиотечный язык – и русский, и английский – перегружен терминологией математики, философии, логики, семантики, информационных технологий.

Тысячелетия в библиографическом описании существовали понятия «автор», «заглавие» и т.п. В XX в. их стали называть элементами библиографического описания и объединили в области. При этом элементы и области сохраняли привычные названия. К концу века появилось исследование «Функциональные требования к библиографическим записям» (Functional requirements for bibliographic records, FRBR), которое выстроило модель библиографической записи из объектов, атрибутов и связей, но в глубине этих понятий всё равно были заключены узнаваемые «авторы» и «заглавия».

Наступил XXI в. – появились инновационные международные документы «Описание ресурса и доступ» (Resource Description and Access, RDA) и «Модель/структура описания ресурса» (Resource Description Framework, RDF), а с ними – незнакомые термины, незнакомый язык современной каталогизации.

Отечественная каталогизация всегда чутко реагировала на инновации в международном сообществе. А наш журнал – «Научные и технические библиотеки» – оперативно информировал библиотечную общественность о новых явлениях и тенденциях. В «НТБ» впервые появились сообщения о «Международном стандартном библиографическом описании компьютерных файлов» (International standard bibliographic description for computer files, ISBD(CF)), позднее преобразованном в «Международное стандартное библиографическое описание электронных ресурсов» (International standard bibliographic description for electronic resources, ISBD(ER)).

Мы также оперативно информировали читателей и об основных этапах создания Консолидированного издания «Международного стандартного библиографического описания» (ISBD. Consolidated edition). Большое внимание уделяли терминологическим проблемам: сложным для однозначного понимания терминам FRBR; терминам, связанным с типологией электронных ресурсов; эволюции термина «Общее обозначение материала», который превратился в Консолидированном издании ISBD в новую область 0 – Область формы содержания и типа средства.

Подробно отслеживали и перипетии пересмотра «Англо-американских правил каталогизации» (Anglo-American Cataloguing Rules, AACR) – от расширенных, обогащённых, но традиционных правил AACR3 к правилам RDA – по структуре и духу соответствующим FRBR.

Среди инноваций последнего времени – возникновение и быстрое проникновение в базовые каталогизационные документы нового понятия «пространство имён» (namespace). Только во внешних ресурсах РГБ – 1 239 публикаций на эту тему. Вот почему мы решили осветить её в «НТБ».

Для библиотекарей термины «пространство» и «имена» существовали раздельно. Пространства: векторное, евклидово, космическое, ономастическое, трёхмерное, этнокультурное, информационное и др. Имена: личное, духовное, мирское, подлинное, родовое, собственное и др. Но в параллельном компьютерном мире эти слова соединились в один термин.

Пространство имён – некоторое множество, под которым подразумевается модель, абстрактное хранилище или окружение, созданное для логической группировки взаимосвязанных имён или терминов, классов, интерфейсов, функций, констант и других уникальных идентификаторов.

Идентификатор, определённый в пространстве имён, ассоциируется с этим пространством. Один и тот же идентификатор может быть независимо определён в нескольких пространствах. Таким образом, значение, связанное с идентификатором, определённым в одном пространстве имён, может иметь такое же значение, как и такой же идентификатор, определённый в другом пространстве.

Сфера применения этого явления – прежде всего компьютерное пространство, откуда это понятие перекочевало в IFLA, ISBD, FRBR, FRAD, FRSAD, UNIMARC и даже в многоязычный словарь по каталогизации MulDiCat. Свои пространства имён имеют или разрабатывают MARC21, RDA и другие «стандарты».

Пространство имён в XML. XML (Extensible Markup Language) – расширяемый язык разметки, представляющий собой свод общих синтаксических правил. XML – текстовый формат, предназначенный для хранения структурированных данных, обмена информацией между программами, а также для создания на его основе более специализированных языков разметки.

Пространство имён в XML – это стандарт Консорциума Всемирной паутины (World Wide Web Consortium, W3C), описывающий совокупность имён элементов и атрибутов, служащую для обеспечения их уникальности в XML-документе. В 2009 г. третья редакция стандарта получила статус рекомендации (Namespaces in XML 1.0. W3C Recommendation).

Основной причиной возникновения неймспейсов (термин применяется и в такой форме) явилась необходимость различать XML-элементы, обладающие одним и тем же именем, но имеющие разный смысл и предназначение, относящиеся к разным словарям разметки. В каждом словаре задано своё пространство имён – так разрешается проблема неоднозначности имён элементов и атрибутов.

Пространство имён сначала объявляют с помощью набора зарезервированных атрибутов. Имя такого атрибута должно либо быть xmlns, либо начинаться с xmlns: … Атрибут xmlns играет роль разделителя на книжном стеллаже: он разделяет различные классы элементов и атрибутов, чтобы их легче было применять в документе, не происходило путаницы. Существуют два способа объявления неймспейсов: с префиксом и без префикса.

Префиксный – это такой способ объявления пространства имён, при котором задаётся его имя. При использовании такого пространства имён всегда необходимо применять в дальнейшем расширенный вид имени элемента (или атрибута), чтобы указать на то, к какому пространству имён относится этот элемент (или атрибут). Для объявления префиксным способом используется следующая конструкция:

xmlns: имя_пространства_имён="URI_пространства_имён".

Беспрефиксный способ подразумевает объявление пространства имён по умолчанию для имён элементов и атрибутов, записанных в обычной форме. Его запись выглядит так же, как и при использовании префиксного способа, но без имени пространства_имён, т.е.:

xmlns="URI_пространства_имён".

Здесь префикс – это некоторое внутреннее имя XML-документа, можно использовать любой префикс. А URI фиксируется раз и навсегда, чтобы при виде этого URI было понятно, какой словарь разметки он представляет.

Пространство имён, объявленное для какого-либо элемента, является таковым для всех вложенных в него элементов, если для них не объявлено других пространств имён. Добавляя в документ новое пространство имён, мы делаем соответствующую привязку всех элементов и атрибутов, использующих его, к определённому адресу в Интернете. Этот адрес указывает на веб-страницу, на которой расположена информация о том, какие элементы и атрибуты может включать в себя данное пространство имён.

Пространства имён IFLA – Требования и параметры (IFLA Namespaces – Requirements and Options) разработаны Целевой группой IFLA по пространствам имён (IFLA Namespaces Task Group) в 2010 г., обновлены в 2011 г.

Тема пространства имён отражает текущую деятельность внутри сообществ IFLA. Это проект Группы пересмотра FRBR по пространству имён; работа Секций каталогизации, классификации и индексирования; ведение «Многоязычного словаря терминов и понятий по каталогизации» (Multilingual dictionary of cataloguing terms and concepts, MulDiCat) на веб-сайте IFLA; совместная работа ICADS (IFLA-CDNL Alliance for Digital Strategies) с UNIMARC и MARC форматами; работа Исследовательской группы ISBD/XML (ISBD/XML Study Group).

Термин «пространство имён» используется здесь более широко, чем в его обычных технических определениях, и охватывает все аспекты совместимости с Семантической паутиной, Семантическим Вебом (Semantic Web). Семантическая паутина – это направление развития Всемирной паутины (World Wide Web), целью которого является представление информации в виде, пригодном для машинной обработки.

В обычной Паутине, основанной на HTML-страницах, информация заложена в тексте страниц и извлекается человеком с помощью браузера. Семантическая же паутина предполагает запись информации с помощью онтологий. Семантическая паутина работает параллельно с обычной Всемирной паутиной и на её основе, используя протокол HTTP и идентификаторы ресурсов URI.

Документ IFLA содержит требования и рекомендации, посвященные пространствам имён IFLA, развитию стандартов (для чего создана новая Группа по программе стандартизации), координации деятельности с другими заинтересованными сообществами.

Требования и рекомендации IFLA (их всего 9) следующие:

Осуществлять мониторинг пространств имён IFLA, FRBR, FRAD, FRSAD, ISBD, MulDiCat и связи между ними;

Осуществлять связи с не-IFLA пространствами имён – Dublin Core, MARC21, RDA;

Исследовать сообщества пространств имён в плане  способности к взаимодействию (интероперабельности);

Осуществлять связи между доменами (архивов, библиотек, музеев, и т.д.) и их схемами и данными.

 

Пространство имён в FRBR (Namespace for FRBR) подготовлены Группой пересмотра FRBR (FRBR Review Group) в 2008 г. с конкретной задачей – «определить соответствующие пространства имён для FRBR (объект-связь) (FRBR (entity-relationship), FRBR (ER)) в RDF и других соответствующих синтаксисах». RDF является стандартом W3C для описания веб-ресурсов в Интернете, моделью описания, набором спецификаций, разработанных Консорциумом W3C, чтобы обеспечить средства моделирования метаданных в различных форматах (синтаксисах). Форматом, обычно связанным с RDF, является XML. Необходимо использовать XML-пространства имён для словарей объектов и связей FRBR, чтобы они были совместимы с RDF.

Словари FRBR составляют часть онтологии, которая может быть описана с использованием RDF схемы (RDFS). RDFS также является рекомендацией W3C. RDFS требует применения унифицированных идентификаторов ресурсов (URI, похожих на URL-адреса) для обозначения машиночитаемых мест для содержания пространства имён.

Основным стимулом проекта было формирование Целевой группы DCMI RDA (DCMI/RDA Task Group). Цель этой группы – определение компонентов RDA в качестве словаря RDF для использования при разработке приложений Dublin Core. Среди ближайших задач Группы пересмотра FRBR – создание «фирменного» домена пространства имён FRBR. Группа пересмотра FRBR должна также гарантировать, что пространство имён FRBR, основанное на FRBR (ER), может быть интегрировано в любое пространство имён объектно-ориентированного FRBR (FRBR-object oriented, FRBRoo).

Пространства имён ISBD (ISBD Namespaces), разработанные группой пересмотра ISBD (ISBD Review Group) и исследовательской группой ISBD/XML для консолидированного издания ISBD, были опубликованы в RDF в 2012 г.

Словари элементов ISBD включает в себя классы и свойства RDF, соответствующие элементам ISBD. Шесть словарей дают контролируемые терминологии области 0 ISBD: формы содержания, характеристики содержания и типы средства. Каждый класс, понятие и свойство имеют унифицированный идентификатор ресурса (URI) для использования триады  данных в Семантическом Вебе. Словари ISBD предоставляют быстрые ссылки для зарегистрированных наборов элементов ISBD. Каждый набор элементов или словарь понятий имеет ссылку на общее описание.

При использовании в обычном веб-браузере URI отображает HTML-страницы с человекочитаемой информацией об элементе или концепции. При использовании в семантическом браузере URI получает машиночитаемую информацию в RDF/XML формате. Кроме того, можно извлечь этот формат, используя обычный веб-браузер. Например, URI для ISBD формы содержания «музыка» является:

http://iflastandards.info/ns/isbd/terms/contentform/T1004.

Для получения RDF/XML-информации в обычном веб-браузере используется URI:

http://iflastandards.info/ns/isbd/terms/contentform/T1004.rdf.

 

Представляя документ о пространствах имён ISBD, Гордон Дансайя (Gordon Dunsire), руководитель Исследовательской группы ISBD/XML, отметил несколько ключевых моментов:

1. Сведения о метаданных в пространствах имён ISBD построены в трёх частях, которые называются «триада (тройка, триплет)» (triple): субъект – предикат – объект.

Название книги «Остров сокровищ»

Субъект сведений = субъект: Эта книга

Природа сведений = предикат: имеет название

Значение (величина, ценность) сведений = объект: «Остров сокровищ»

Эта книга – имеет название – «Остров сокровищ»

2. Унифицированный идентификатор ресурса может быть любым уникальным сочетанием  цифр и букв, может выглядеть как URL.

3. RDF требует субъекта и предиката из триады для URI.

Объектом может быть URI, или символьная строка («Остров сокровищ»).

4. Можно присвоить текущий «номер» базе, чтобы создать новый URI. Можно использовать набор свойств (= предикатов) для создания основных триад. Например, rdfs: для присвоения человекочитаемой метки свойству (или классу) RDF:

isbd: P1001 – rdfs: метка – «имеет содержание формы»

«Пространства имён ISBD» сохраняются и доступны с помощью Открытого реестра метаданных (Open Metadata Registry, OMR).

 

Теория пространств имён не проста и многим кажется избыточной, но она существует, хорошо зарекомендовала себя в разных областях, вошла в нашу библиотечную жизнь и потому достойна внимания профессионалов. Возможно, сейчас зарождается будущее библиографического описания и всей каталогизации.

  
На главную  |  Полнотекстовый поиск  |  Сайт ГПНТБ России  |  Оформление подписки  |  Архив  |  Раздел для подписчиков