На главную  |  Полнотекстовый поиск  |  Сайт ГПНТБ России  |  Оформление подписки  |  Архив

Земсков А.И., Шрайберг Я.Л. Электронные библиотеки
Содержание:


Пояснительная записка

Учебно-тематический план

РАЗДЕЛ 1. Электронная библиотека: введение, этапы развития, определение, возможности электронных библиотек, структура, классификация (темы лекций 1, 2)

РАЗДЕЛ 2. Ресурсы электронных библиотек: определения, виды ресурсов, создание, комплектование, хранение электронных ресурсов (темы лекций 3, 4, 5, 6, 7)

РАЗДЕЛ 3. Средства доступа к электронным ресурсам: основные понятия , стандарты, проблемы безопасности и авторского права (темы лекций 8, 9, 10, 11)

РАЗДЕЛ 4. Социальная значимость электронных библиотек. конкретные проекты. методология подготовки библиотекарей и пользователей (темы лекций 12, 13, 14)

Рекомендуемые темы курсовых и дипломных работ

Перечень рекомендованной литературы


РАЗДЕЛ 2

РЕСУРСЫ ЭЛЕКТРОННЫХ БИБЛИОТЕК:
ОПРЕДЕЛЕНИЯ, ВИДЫ РЕСУРСОВ, СОЗДАНИЕ, КОМПЛЕКТОВАНИЕ, ХРАНЕНИЕ ЭЛЕКТРОННЫХ РЕСУРСОВ

(темы лекций 3, 4, 5, 6, 7)

Теоретическая база Раздела 2

Вводные части данного раздела опираются на теоретические разработки по документоведению, фондоведению и информационным ресурсам, сформулированные и развитые учеными ГПНТБ России, МГУКИ, Российской государственной библиотеки, научно-технического центра «Информрегистр» и других библиотек и научных центров, ведущих исследования в этой области. Принципиальных гносеологических различий в понятия «документ» и «электронный документ», «публикация» или «электронная публикация» нами не вносится. Детальная типология электронных ресурсов опирается на их имманентные свойства – дискретность, машиночитаемость и др. Тем не менее, мы рекомендуем студентам придерживаться следующего определения понятия «электронный документ», чтобы избежать разночтений и неточностей: «электронный документ — это законченный по содержанию массив информации, зафиксированный машиночитаемым образом на материальном носителе».

Весьма кратко излагаются технологические основы записи информации; мы исходим из того, что данный материал студентам уже знаком по другим курсам, в частности из курса «Информатика».

Развитие конкретных видов электронных ресурсов дается в историческом аспекте – от электронных каталогов, библиографических и реферативных баз данных до полнотекстовых и мультимедийных материалов. Современные подходы к созданию и экономному использованию справочно-поискового аппарата (будь-то каталогизация документов или объединенные системы метаданных для издательств, книготорговли, способные к восприятию в библиотеках) рассматриваются нами как вероятные направления развитие этого вида библиотечных технологий. Следует коротко представить наиболее известные системы метаданных, в первую очередь, Дублинское ядро (Dublin Core), которая сегодня принята в качестве нац. cтандарта в ряде стран, MARC – библиографические форматы, самые распространенные и общепринятые в мире, ONIX – формат описания товара в системах электронной книжной торговли, LOM, GILS и ряд других.

Особое место отведено рассмотрению электронных книг (e-books) как специфического вида потенциально интересных библиотечных ресурсов, уже достаточно распространенных на Западе, способных содействовать обслуживанию пользователя вне стен библиотеки; это же носитель может быть полезным при распространении учебно-методических материалов.

Экономические проблемы записи и хранения информации даны на примере компактных оптических дисков CD-ROM. Опираясь на концепцию так называемого жизненного пути издания проведено сравнение экономических показателей обслуживания для традиционной и электронной технологий.

Лекция 3. Электронные ресурсы: определения,
типология и характеристики

Настала эпоха электронных публикаций, но это вовсе не означает, что прошло время для печатных публикаций (до сих пор 90% всех документов существуют на бумажных носителях). Эти технологии сосуществуют и будут сосуществовать так же, как уживаются вместе драматический театр и кинематограф, телевидение и кино, Интернет и телевидение. По мере появления новой технологии расширяются возможности, полнота раскрытия материала и детальность восприятия пользователя.

Все еще существует некоторая условность определения «электронные ресурсы», хотя определения «электронный документ» и «электронное издание» («электронная публикация») четко сделаны с акцентом на машиночитаемость данного вида ресурсов. Термин «машиночитаемость» взят в качестве устоявшейся в русском языке кальки с английского Machine Readable – откуда пошли хорошо известные аббревиатуры для библиографических форматов MARC (Machine Readable Cataloguing) – хотя, конечно, в данном случае речь идет о пригодности указанных ресурсов к обработке на персональных компьютерах без какой-либо дополнительной подготовки.

Определение: Электронные ресурсы — это совокупность электронных документов, образованная преднамеренно или в результате случайных действий или событий.

Виды электронных документов (типология)

Свойства электронных ресурсов. Базисные свойства электронных ресурсов:

  • машиночитаемость;
  • дискретность, конечность и счетность массива данных;
  • однородность массива данных безотносительно характеристик отражаемого объекта (черно-белое или цветное изображение, одномерный или многомерный объект, подвижный или покоящийся объект, текст или звук и т.п.);
  • зависимость от программно-аппаратного обеспечения для их использования;
  • способность к совмещению разнородной информации (мультимедиа);
  • способность к клонированию, то есть к созданию абсолютно идентичных (в принципе неразличимых) копий оригинального цифрового документа;
  • неиссякаемость при копировании;
  • возможность дистанционного управления электронными ресурсами (обработка, копирование, пересылка и т.д.);
  • неодинаковая чувствительность к появлению ошибок в записи: заведомая избыточность данных некоторых массивов (например в музыкальных файлах, в записи изображений) и в то же время уязвимость к появлению любой ошибки или неточности в некоторых критических местах (например, в компьютерных программах, системах управления базами данных, Интернет-адресах и т.п.);
  • возможность организации самоконтроля и устранения ошибок в массивах данных;
  • уязвимость по отношению к зловредным действиям со стороны других электронных документов (например, со стороны вирусов).

Классификация электронных ресурсов по их отношению к печатным ресурсам:

  • электронные ресурсы, не имеющие печатных аналогов (электронная почта, домашние страницы и другие материалы вебсайтов, дискуссионные группы в Интернете, некоторые научные и популярные журналы, базы данных, мультимедийные материалы, специфические виды рекламы, вирусы и т.п.),
  • электронные ресурсы, созданные для поддержания имеющихся печатных ресурсов, например, для обеспечения сохранности или расширения и улучшения обслуживания пользователей (в частности, организация мультидоступа для спрашиваемых изданий), и подлежащие долговременному хранению (электронные книги, цифровые версии печатных документов и т.п.),
  • электронные ресурсы, создаваемые на короткий срок в технологических целях на основе печатных ресурсов и не предназначенные для долговременного хранения или подлежащие уничтожению после однократного использования (копии материалов, используемых в системе МБА и доставки документов в библиотеках, электронные справки, квитанции и т.д.).
  • незаменимые (пока!) виды печатных документов (грамоты, награды, паспорта, водительские права, бумажные деньги и т.п.); симбиоз печатных и электронных документов: кредитные карты, магнитные пропуска и билеты с магнитной записью.

Основные типы электронных ресурсов с указанием отличий от традиционных документов:

  • полнотекстовые документы, электронные журналы с возможностями поиска, наличием гиперсвязей, и автоматического агрегирования;
  • таблицы с расширенными функциями обработки данных и демонстрации результатов (спрэдшиты);
  • библиографические, реферативные, адресно-справочные, фактографические, полнотекстовые и иные базы данных с возможностями поиска, библиотечные электронные каталоги различных типов и библиографические указатели;
  • рисунки и изображения с возможностями обработки файлов по размерам, цвету, пространственным параметрам изображения и построения многомерных изображений;
  • аудиозаписи и музыка, видео, компьютерная анимация;
  • цифровые карты и картографическая информация;
  • компьютерные программы, в том числе программы и команды непосредственного исполнения;
  • вирусы и им подобные типы зловредных компьютерных программ;
  • мультимедийные материалы (совмещение разных видов ресурсов, например, текст и звук; текст, изображение, звук; текст и анимация и т.д.),
  • агрегированные подборки, изготовленные «на лету», автоматическим методом;
  • другие.

Общее представление о мультимедийных ресурсах
как о перспективном виде электронного ресурса

Примеры известных отечественных мультимедийных и обучающих систем на CD-ROM (рис. 11–14).

Рис. 11. Энциклопедия "Мир вокруг нас" на CD-ROM

Рис. 12. Большая энциклопедия Кирилла и мефодия (на 8 CD-ROM)

Рис. 13. Энциклопедия создания и развития космической индустрии
в России "Русские в космосе" на CD-ROM

Рис. 14. Интерактивный учебный комплекс
"Электронные библиотеки" на CD-ROM

Мультимедийные ресурсы более детально освещены в курсе «Мультимедийные технологии», также читаемом студентам данной и других специализаций.

Виды электронных ресурсов по общественному назначению: научные, образовательные, библиотечные и развлекательные материалы, художественная и научно техническая информация, СМИ (новости, ТВ), объявления, реклама, пропаганда, электронная коммерция, производственная, технологическая и финансовая информация, системы автоматизации экспериментов, проектных работ, производства, другое.

Виды электронных ресурсов по степени доступности: бесплатные, условно бесплатные, платные, закрытые для публичного доступа, в том числе закрытая и/или конфиденциальная информация (режимно-секретная), коммерческая, промышленная и технологическая информация, финансовые и налоговые сведения, частная жизнь. Следует отметить существующее различие в российском и международном толковании понятий «публичная информация» и «конфиденциальная информация». Примеры адресов вебсайтов с информацией о защите частной жизни приводятся на практическом занятии 1. Обработка электронных текстов: необходимо знать основные (по названиям) кодировки кириллического и латинского алфавитов, коды ASCII, ISO, UNICODE, таблицы ISO и таблицы Библиотеки Конгресса США для представления кириллических алфавитов. Отечественные стандарты и вводная информация по системе СИБИД. Разметка текстов: обогащенный текстовый формат, формат документа с версткой и встроенной графикой, языки разметки SGML, HTML, XML. Обработка электронных ресурсов – изображений; простой формат изображения. Некоторые примеры других форматов: гипертекстовый формат, формат баз данных, форматы для фотографии и музыкальных файлов примеры из Интернет. Отличия и предпочтения, некоторые рекомендации по выбору и использованию. Рекомендации по изучению языка HTML, отсылка к специализированным руководствам, разработанным в последние годы, в том числе и сотрудниками кафедры [5, 6, 38].

Практическое занятие 1 по теме лекции 3 (три учебных часа). Ознакомление с общим состоянием дел в области российских электронных ресурсов, роль государственных центров, «Закон об обязательном экземпляре». Практическая работа в Интернете по выбранной тематике российских электронных ресурсов (например, по материалам лекции 12).

Лекция 4. Электронные ресурсы: типология и технические
характеристики носителей информации

В лекции дается общее представление о технических средствах – носителях электронного ресурса. Сервер – достаточно мощный компьютер, совместимый с персональными компьютерами, средство хранения и обработки электронных ресурсов. Типовой состав локальной вычислительной сети (ЛВС): сервер, персональные компьютеры, средства коммуникации.

Краткое описание физических принципов записи
(фиксирования) информации

Классификация носителей информации по физическим характеристикам.

Физические основы записи цифровой информации:

  • оптические свойства: проницаемость для света (перфокарты); светоотражающая способность (оптические компакт-диски);

  • изменения электрической проводимости: открытое или закрытое положение транзистора;

  • изменения намагниченности (магнитные ленты);

  • изменения квантовых параметров;

  • другие параметры.

Форма носителя: диски, ленты, плоские платы памяти – микросхемы. Среда записи и считывания информации: магнитные носители, оптические носители, смешанные магнитооптические носители, платы памяти – микросхемы.

Физический носитель информации на сервере локальной вычислительной сети (ЛВС), Интернет-сервере и в любом персональном компьютере (жесткий диск) – система, состоящая из набора вращающихся на одной оси плоских дисков диаметром несколько сантиметров, покрытых магнитным слоем. Эксплуатационные свойства жесткого диска: большая емкость, быстрый доступ к записанной информации, высокий темп считывания информации и взаимозаменяемость (стандартизация дисков). Быстрый доступ к информации обеспечивается небольшим расстоянием, которое проходит считывающая головка при поиске нужного места, а также записью информации в предварительно созданные (отформатированные) секторы на диске.

Технические особенности, обеспечивающие малый износ головок и магнитного слоя поверхности пластины. Для ресурса сервера опасно не количество отработанных часов, а число включений, связанных с «посадкой» головок и разгоном дисков. Указанная особенность конструкции сервера дает возможность при наличии устройств бесперебойного питания оставлять сервер включенным в течение многих суток (недель). Таким образом достигается одно из существенных преимуществ электронной библиотеки – обслуживание пользователя 24 часа в сутки круглый год. Оптимизация структурной схемы локальной сети, размещение устройств, защищающих от несанкционированного доступа – межсетевых защитных экранов.

Носители информации на магнитных лентах, их преимущества: освоенные технологии производства и высокая плотность записи, высокая скорость считывания информации и большая емкость. Неустранимый недостаток магнитных лент – большое время доступа к информации, «пульсирующий» (а не равномерный) характер эксплуатации, постепенное стирание магнитного слоя, ухудшение записи из-за размагничивания ленты, вытягивание ленты-основы в ходе эксплуатации. Цифровые устройства хранения информации: стримеры, ленточные накопители емкостью до 100 Гбайт, цифровые хранилища – роботизированные библиотеки с суммарной емкостью 10 Терабайт, темпом передачи данных до 10 Мбайт/сек.

Другие физические носители информации: компактные оптические (или магнитооптические) диски. Диски «только для чтения» CD-ROM с предварительно записанной и неизменяемой информацией. Основы конструкции оптического компакт-диска, стандарты, главные преимущества и недостатки. Встроенные в компьютер устройства с возможностью ускоренного вращения диска. Отдельные хранилища на 50–100 дисков с механической подачей диска на считывание; специальные системы, допускающие одновременное считывание с нескольких дисков. Технология двусторонних дисков высокой плотности записи – DVD.

Встроенные устройства записи информации на оптические диски CD-WR (однократной записи), CD-R (многократной записи) как дополнение штатного жесткого диска компьютера. Семейство перезаписываемых дисков, перспективных для использования в работе библиотек и центров информации: DVD-RW (1 тыс. перезаписей) и DVD-RAM (100 тыс. перезаписей). Рыночная роль традиционных компакт дисков CD-ROM иллюстрируется Табл. 2.

Вспомогательные носители информации: гибкие диски 1,44 Мб, переносные жесткие диски, устройства типа Flash емкостью до 2 Гбайт, карты памяти для цифровых камер, аудиоплейеров. Ноутбуки, субноутбуки, карманные персональные компьютеры («наладонники») и т.п.

Принципиальное изменение концепции целесообразности применения портативных устройств всвязи с развитием Интернет и мобильной связи.

Таблица 2

Рыночная роль различных типов аудио видео дисков
(количество и объемы продаж в мире в 2003 году, данные Американской ассоциации звукозаписи, Recording Industry Association of America)

 

No

 

Тип аудио диска

Количество проданных

дисков, штук

Объем
продаж,

долларов

1

Музыкальные CD

745 900 000

11 232 900 000

2

Усовершенствованные
компакт-диски SACD

1 300 000

8 000 000

3

Виниловые долгоиграющие

пластинки

1 500 000

21 700 000

4

Audio DVD

400 000

26 300 000

Сравнительная экономика хранения цифровых данных на различных видах носителей приведена в Табл. 3 (данные по состоянию на 2001 г.).

Таблица 3

Сравнительная стоимость хранения массива данных
объемом 1 Мегабайт на различных видах носителей

Носитель

Стоимость (долл.)

Кратность стоимости
в сравнении с CD-ROM

Бумага

5.00

х 2000

Жесткий диск

1.65

х 660

Микрофиша

0.76

х 304

Гибкий диск

0.42

х 168

Стриммер
(лента 9 дорожечная)

0.25

х 100

Магнитооптический диск

0.19

х 76

Выносной (портативный) жесткий диск

0.12

х 48

WORM

0.10

х 40

CD-R

0.32

х 13

Стриммер (DAT)

0.015 – 0.01

х 6-4

CD-ROM

0.0025

х 1

Семинар по теме лекции 4 посвящен обсуждению типологии электронных ресурсов, особенностям доступа, форматам записи и хранения электронных ресурсов. Обсуждаются понятия и примеры баз данных, электронных каталогов, электронных книг, полнотекстовых электронных журналов. Для обсуждения также предлагаются стоимости оценки хранения электронных данных на различных носителях (Табл. 5).

Практическое занятие 2 по теме лекции 4 направлено на предоставление возможности студентам самостоятельно работать с Интернет-ресурсами по науке и технике, аннотированными Библиотекой Конгресса США, Московским государственным университетом, Техническим университетом г. Берлина, Российской государственной библиотекой, Еврейским университетом в г. Иерусалиме, Британской библиотекой, а также с рядом баз данных на CD-ROM по научно-техническому профилю «Science Citation Index», INSPEC, «Chemical Abstracts», «CREY Literature» (ГПНТБ России), электронным каталогам БЕН РАН, ЦНСХБ, ГПНТБ России, ГПНТБ СО РАН, отражающих отечественные ресурсы по науке и технике, кооперативным системам публичных и вузовских библиотек в (первую очередь корпоративной сети московских библиотек (КСМБ) и ряду других.

Лекция 5. Электронные ресурсы: каталоги, базы данных,
графические материалы, электронные книги

Определение электронной публикации.
Доступность электронной публикации. Мультидоступ

Определение: «Электронная публикация – машиночитаемый документ, преднамеренно созданный для ознакомления с ним неограниченного круга лиц и обеспеченный для этого средствами доступа». Определение «Электронные публикации» не подразумевает участие электронов или электронной структуры вещества в создании или пользовании этими материалами, как иногда пытаются толковать студенты, проявляющие свою эрудицию. Роль электронов в работе с электронными публикациями ничуть не более, чем в работе с печатным публикациями (пример тому – перфокарты, на которых записывается цифровая информация).

Примеры первых электронных ресурсов: электронные каталоги, библиографические, реферативные и фактографические базы данных; электронные книги, электронные полнотекстовые журналы.

Определение: «База данных (БД) – тематически собранный и структурированный массив информации, состоящий из большого набора однотипных элементов». Число элементов («записей») – от сотен до нескольких миллионов. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора «полей» или «областей»). Число полей – от 2 до сотни и более, в зависимости от характера использования базы данных. Заполнение некоторых полей может быть обязательным, а некоторых – факультативным; поля могут делиться на подполя. Размер отдельной записи может быть ограничен каким-то количеством знаков или слов. Основное свойство БД – возможность проводить поиск информации и другие действия по любым выбранным полям или по их произвольной комбинации.

Одной из наиболее значимых компонент систем библиотечной автоматизации и одновременно специальной БД является электронный каталог библиотеки. Электронный каталог – главный продукт библиотечной автоматизации и обеспечение доступа к нему, во многом определяет эффективность последней. Каталогизация текущих поступлений, в том числе методом заимствования («корпоративная каталогизация»); ретроспективная конверсия как средство улучшения доступности депозитарных или архивных материалов. Представлен Сводный каталог как средство использования распределенного библиографического и адресно-справочного ресурса; приводятся примеры Сводных каталогов в России и за рубежом; оцениваются предпосылки к устойчивому функционированию системы использования распределенных ресурсов и применение технологий ЭБ в этих целях. На практических занятиях отрабатывается поиск в Российском Сводном каталоге научно-технической литературы (www.gpntb.ru), демонстрируется доступ к другим российским и зарубежным Сводным каталогам. Представляются образцы записей баз данных Сводного каталога НТЛ.

Из общего объема продаж 1 700 млн евро НТМ публикаций в 2002 году 42% приходится на сетевые продукты; лидируют компании Эльзевир, Клювер и Томсон. В 2003–2004 гг. ситуация не изменилась.

Таблица 4

Изменения доли (процент объема продаж) традиционных и сетевых
продуктов на Европейском рынке научно-технической и медицинской
информации (по данным исследовательской компании IRN)

Формат

Годы

2000

2001

2002

2003

Сетевые  продукты
(
online)

31%

32%

42%

46%

Традиционные
продукты (
hard copy)

69%

68%

58%

54%

Таблица 5

Основные поставщики сетевых продуктов на европейском рынке
научно-технической и медицинской информации (результаты
анкетирования 110 специалистов Великобритании, Германии,
Франции, проценты пользователей данного продукта)

No

Наименование сетевого продукта, компания

Процент респондентов,
пользующихся данным продуктом

1.

Science Direct (Elsevier)

56%

2.

Web of Knowledge
(Thomson)

43%

3.

Springer Verlag

34%

4.

Wiley Interscience

30%

5.

Ovid/Silver Platter

25%

6.

Kluwer Online

24%

7.

Cambridge Scientific
Abstracts, CSA

21%

8.

STN (FIZ Karlsruhe)

17%

9.

INIST-CNRS

17%

Основная часть пользователей STN находится в Германии, а пользователей INIST-CNRS – во Франции. Для Эльзевира продажи Science Direct приносят 75% дохода от подписки, для компаний Thomson и Wiley сетевые продукты приносят более 60% дохода. 90% опрошенных начальные этапы работы в сети проводят с бесплатными источниками, и только на завершающей стадии обращаются к поставщикам платной информации.

Краткое знакомство с семействами форматов библиографического описания MARC (Machine Readable Cataloguing) как основы межбиблиотечного и международного взаимопонимания и совместного использования библиографических ресурсов: MARC-21, UNIMARC, RUSMARC их сходства и отличия. (Детальное изучение библиографических машиночитаемых форматов с 2001/2002 учебного года дается в учебном курсе «Информационное обеспечение АБИС», читаемом на кафедре информационных технологий и электронных библиотек МГУКИ.)

Отдельно рассматривается использование в библиотеках корпоративных и коммерческих баз данных каталогизации, основные сведения о корпоративных системах OCLC/PICA, RLIN. Поисковые протоколы Z39.50, HTTP; основные преимущества и недостатки. На рис. 15 приведены примеры записей Российского Сводного Каталога по научно-технической литературе (держатель – ГПНТБ России, объем – около 650 тыс. записей), а на рис. 16 – главная страница вебсайта OCLC – крупнейшего в мире онлайновой библиографической системы и центра корпоративной каталогизации, содержащей Мировой Сводный Каталог (World Cat – около 50 млн записей). На рис. 17, 18 приведены примеры двух известных систем OCLC. В целом OCLC – уникальный пример современного воплощения информационных технологий в практике библиотечно-библио-графической деятельности, в создании электронных библиотек. Известная американская корпорация OCLC(Online Computer Library Center) была создана в 1967 г. как библиотечный онлайновый центр, объединивший деятельность колледжей штата Огайо (Ohio College Library Center – та же аббревиатура OCLC), и позволила 54 колледжам штата обмениваться информационными ресурсами, сократив свои финансовые затраты на каталогизацию и улучшив доступ к библиотечным фондам. На 01.01.2005 г. услугами OCLC пользуются более 50,5 тыс. библиотек из 95 стран мира.

 

Профессиональная деятельность OCLC нацелена на совершенствование всеобщего доступа к международной инфор-мации, как для научно-образовательной деятельности, так и для сокращения расходов в библиотечной деятельности. Члены OCLC обязаны выполнять текущую каталогизацию в режиме онлайн или передавать данные на магнитных носителях. При этом они получают дополнительные возможности по услугам корпорации для обычных своих пользователей. Для библиотек-партнеров OCLC служит богатым источником разнообразных готовых библиографических записей, и представляет возможность их заимствования. По данным опроса партнеров пользователи в среднем находят в каталоге информацию на более чем 94% документов, которые они каталогизируют.

Возможности создания, развития и поддержки устойчивой работоспособности средств телекоммуникации в библиотеках, объединенных корпоративной деятельностью способствует расши-рению этих направлений работ.

Очень важной характеристикой деятельности OCLC является наличие развитой структуры служб, в число которых входит служба Сводного каталога WorldCat, служба каталогизации, служба МБА, служба ретроспективной конверсии и другие службы.

В лекции и в особенности в практических занятиях проводится закрепление результатов поиска, составление свода указателей полезных адресов типа автоматизированных «Книжных закладок».

Полезным оказывается изучение сайта OCLC (www.oclc.org).

Краткая информация о метаданных. Метаданные – это информация об информации, описание электронных ресурсов общепринятым рекомендациям, наиболее распространенными среди которых являются протокол Dublin Core (Дублинское ядро) для основных сетевых ресурсов), vCard (для персоналий и обмена данными о них), iCalendar (для обмена данными о последовательности событий, календарях и т.д.), Z39.87 (для неподвижных цифровых изображений), PDM (для описания проектов как информационных объектов), АВС (для облегчения интероперабельности между онтологиями метаданных в различных доменах), СС/РР (для адаптации контента интернета к аппаратной платформе пользователя), EAGLES (для связей между смыслами слов, для принципов EAGLES-стандартов в области лексики и семантики), ISO 6523 (для создания набора данных, связанных с организациями), ISO 810 (транспортный протокол OSI), ISO 11179 (для описания элементов данных в базах данных и документах), METS (для обмена метаданными между библиотеками), MREG-7 (для описания мультимедийных данных), MREG-21 (для идентификации и управления объектами мультимедийных презентаций), OIL 9 (для описания терминов онтологии, объектами мультимедийных презентаций),
OIL 9 (для описания терминов онтологии, их ограничений и взаимосвязи), OIM (для моделирования метаданных), OWL (для представления терминов словарей и взаимосвязей между ними).

Кроме общих форматов существует большое число специализированных метаданные для архивов, MARC – для обмена библиографической информацией, для геогафической, медицинской, музейной, экологической, экологической, научной, новостной информации, для дистанционного образования, а также административные метаданные.

Для библиотек наиболее известным набором элементов метаданных является так называемое Дублинское ядро (Dubline Core, DC) используемое для описания разнообразных ресурсов, доступных в Интернет и иных сетях. Стандартизованы пятнадцать элементов Дублинского ядра, которые условно подразделяются на три группы (все элементы не являются обязательными и могут повторяться):

  • элементы, относящиеся к описанию содержания ресурса (заглавие, предмет, описание, источник, язык, отношения, зона действия);

  • элементы, относящиеся к интеллектуальной собственности (автор, издатель, сведения об ответственности, правовые аспекты);

  • элементы, относящиеся к данному экземпляру ресурса (дата, тип ресурса, формат, идентификатор), представлена также 4-уровневая модель произведения ИФЛА.

Другие системы метаданных:

EAD – кодировка архивных описаний,

GILS – глобальная служба поиска информации,

EDIFACT – коммерческая документация и другие. Разработка систем идентификации электронных документов (DOI), ONIX – новый подход к коммуникативным форматам для описания электронных транзакций книготорговли.

Базы данных научно-технической, экономической и финансовой информации, краткое знакомство с основными системами. Отечественные производители баз данных – ВИНИТИ, ГПНТБ России, РГБ, ВНТИЦентр, ВИМИ, Росинформресурс, ГПНТБ СО РАН, Гарант, Росбизнесконсалтинг, ИнтегрумТехно. Зарубежные базы данных (Compendex, Inspec, Medline, CAS, STN, SIGLE и др.), производители и поставщики информации и баз данных – ISI, Thomson, Derwent, Dialog,INIST, OCLC, EBSCO, Elsevier. Национальная регистрация баз данных, роль и значение научно-технического центра «Информрегистр» в описании и сохранении информационных ресурсов.

Примеры организации работы библиотек с электронными ресурсами: начальный этап поиска в бесплатных сетевых источниках и затем переход к коммерческим поставщикам.

Услуги и продукты на основе электронных ресурсов: базы данных оглавлений (таблицы содержания) научных журналов; службы агрегирования, обеспечивающие единую отправную точку, единый пароль и адресацию в сети. Возможность присоединять собственные продукты и базы данных (данные из электронного каталога библиотеки, библиографические базы данных и т.п.). Система ссылок CrossRef, допускающая многовариантный вход пользователя в систему (из базы данных, из сети, от какой-либо собственной страницы) с переходом в основную базу данных через название журнала, определенного номера выпуска или отдельной статьи.

Электронные книги (e-books) как самостоятельный вид платных электронных ресурсов; отличие электронных книг от электронных текстов, основные технологические схемы и системы обслуживания. Примеры использования электронных книг в библиотеках (опыт публичной библиотеки им. Фергюсона в г. Стэнфорд, Коннектикут, США). Электронные книги в Интернет – новая технология; сопоставление с технологиями обслуживания электронными полнотекстовыми журналами. Сравнение технологии поставки информации в виде электронных книг кассетно-картриджного типа с поставкой информации через Интернет.

Визуализация электронных документов:

  • просмотр на компьютерных мониторах;

  • проецирование на большой экран;

  • распечатка, в том числе клонирование оригинального печатного издания;

  • специальные виды воспроизведения для слабовидящих.

Новое технологическое направление формирования привычного для читателя печатного формата в сочетании с возможностями современных компьютерных технологий на базе углеродсодержащих микрокапсул («электронные чернила», e-ink).

Практическое занятие 3 посвящено самостоятельной работе студентов на планшетных сканерах по сканированию графической и полнотекстовой информации, ее сохранению и распознаванию. Первый опыт работы с программой распознавания кириллических текстов ABBYY Fine Reader на основе предложенных преподавателем примеров фрагментов библиографических указателей и картинок печатного каталога.

Лекция 6. Электронные ресурсы: комплектование фонда
и обслуживание полнотекстовыми электронными журналами

Полнотекстовые научные журналы в различных форматах; рост числа и роли электронных журналов; электронная версия печатного формата (чаще всего – формат .pdf, который повторяет изображение печатной страницы). Важность лицензирования и регистрации разрешенных пользовательских групп, особенно в контексте усиления контроля за соблюдением авторских прав.

Ключевая роль библиотекаря при отборе электронных ресурсов для читателей библиотеки. Проблемы обслуживания спрашиваемых изданий печатными копиями из-за ограниченного количества экземплярности. Комплектование зарубежной печатной литературой заметно уменьшилось и по финансовым причинам, и из-за постоянного повышения интереса пользователей к электронным ресурсам, однако возможность доступа к знанию не сократилась из-за появления электронных изданий. Оценки объемов доступной для пользователя информации в традиционном и в электронном формате.

Преимущества электронных журналов: не занимают много места, обеспечивают легкость коммуникации, немедленную доставку информации на письменный стол, снабжены мощным поисковым аппаратом, дают возможность работать с интегрированным текстом, использовать гиперсвязи и мультимедиа, обеспечивают возможность сетевого множественного доступа к материалу одновременно многим пользователям (в соответствии с конкретной лицензией). Мультидоступ как одно из главных преимуществ электронных публикаций перед печатными, особенно в условиях недостаточной экземплярности печатных документов при имеющемся спросе; это преимущество и позволяет многим библиотекам постепенно замещать традиционную подписку на печатные журналы на покупку лицензий для обеспечения доступа своих читателей к полнотекстовым электронным журнальным коллекциям.

Трудности и препятствия на пути применения электронных журналов: обеспечение доступа к изданиям прошлых лет, долговременная архивация, сложные бюрократические проблемы подготовки контракта на лицензирование, стоимость электронных журналов, требование лицензии работать (предоставлять доступ к электронным материалам) в заранее согласованном месте с привязкой к определенному физическому адресу в Интернете, необходимость каждый раз (для каждого наименования журнала) заново переписывать лицензионное соглашение и вести переговоры по нему, неготовность ряда спрашиваемых изданий открыть подобный сервис.

Наибольшую значимость для пользователя имеют: бесплатное тестирование; возможность иметь более детальные описания, методические наработки.

Важные особенности: коллективная подписка (консорциум) и распределенный ресурс, оформление многолетних пользовательских лицензий. Переход от ссылки в конце статьи к полному тексту статьи, на которую сослались, вне зависимости от того, где и кем она публиковалась, например, система перекрестных ссылок CrossRef, которая обеспечивает взаимосвязанный доступ к миллиону статей из нескольких тысяч наименований журналов. Примеры электронных полнотекстовых журналов. Опыт работы российских библиотек с научной электронной библиотекой РФФИ; опыт работы московского консорциума публичных библиотек.

Работа библиотек по формированию систем коллективной подписки с предоставлением доступа к электронным версиям. Стоимость электронных журналов, оценка экономики и сравнение со стоимостью подписки печатных изданий.

Интересные факты единой комбинации электронной и печатной версии, при этом стоимость электронной версии нарочито никак не выделяется. Комбинация электронной и печатной версии, при которой за поставку электронного варианта сверх стоимости одной печатной версии взимается дополнительно от 8 % до 65 % .

Независимая подписка на электронную версию по цене, варьирующейся от 65 % до 150 % от стоимости подписки на печатную версию.

Особый вид библиотечных консорциумов, объединенных идеей совместной подписки на электронные издания. Специальные цены для консорциумов. Что такое консорциумы (корпоративные системы); примеры, опыт объединения в консорциумы российских библиотек. Общие черты: некоторая наценка (надбавка) на стоимость печатной версии дает пользователям возможность получать доступ к электронным версиям всех изданий, включенных в соглашение о консорциуме, а иногда и ко всем публикациям данного издательства; за базовую берется цена подписки на печатную версию; соглашение заключается как правило на три года; иногда дается скидка, пропорциональная количеству библиотек – участники консорциума; иногда за базовую берется стоимость подписки на электронную версию, при этом печатная дается с большой скидкой.

Метод поставки отдельных статей (метод «плати за просмотр»); стоимость отдельной статьи варьируется в зависимости от поставщика, от категории пользователя и от срочности выполнение заказа от 10 до 43 долларов. Опыт систем First Search OCLC, Subito и STN International.

Взимание платы за публикацию с авторов, а не с библиотек или читателей, – например, опыт Нового физического журнала (New Journal of Physics) и ряда других. Отдельно изучается опыт работы ГПНТБ России по обслуживанию читателей электронными журналами и опыт предоставления услуг OCLC.

Иные методы ценообразования:

  • пакет из всех электронных публикаций данного издателя, при этом по желанию поставляется и печатная версия;

  • модель, учитывающая количество штатных сотрудников в учреждении, либо количество лиц, одновременно пользующихся электронными материалами, либо число станций доступа к Интернету;

  • дополнительная плата за поставку программного обеспечения;

  • объединение доступа к содержанию публикаций разных издателей.

Другие проблемные вопросы, рассматриваемые в данной
лекции:

  • создание единого интерфейса, единых точек доступа;

  • формирование связей между библиографическими данными и соответствующими полными текстами;

  • контроль аутентичности пользователя (проверка его права доступа к различным видам ресурсов) и создание централизованной системы контроля платежей в режиме онлайн;

  • посредничество между консорциумами и издателями; консультации и помощь в лицензировании и оплате, поставка готовых информационных систем «под ключ»;

  • обучение и переподготовка библиотекарей и пользователей;

  • помощь издателям при подготовке Интернет-публикаций;

  • формирование архивов электронных ресурсов.

В Российской Федерации зарегистрировано 30 тыс. печатных СМИ; выходят около 12 тыс., на рекламном рынке присутствуют около 1,5 тыс., но лишь всего 122 издания сертифицируют свой тираж (в том числе – «Независимая газета», «Комсомольская Правда», «За рулем», «Мир ПК» и др.), остальные часто вводят в заблуждение своих подписчиков. Утрачен механизм репутации, поэтому российское общество (57% граждан по недавней оценке) согласилось бы
с введением цензуры. Хотя совершенно непонятно как это можно увязать со свободой печати и доступа к информации – основополагающим составляющим информационного общества и будущего общества знаний.

По данным Национального Института прессы, в России около 1200 регулярно обновляемых электронных изданий, из них 2/3 имеют печатную версию; более консервативные оценки – около
300 Интернет-СМИ.

Практическое занятие 4 по теме лекции посвящено продолжению обучения студентов навыкам работы по сканированию полных текстов и графики; но уже на планетарном сканере, в том числе и с системой распознавания кириллицы ABBYY Fine Reader. Для успешно освоивших эту технологию в часы практического занятия предлагается самостоятельная работа с одной из известнейших онлайновых систем баз данных – First Search OCLC, включая и доступ к полным текстам (если нет возможности обеспечить эту технологию, возможной альтернативой может быть работа с базами полнотекстовых данных Elsevier, EBSCO или других компаний).

Лекция 7. Создание и обеспечение сохранности электронных
ресурсов; технологические и организационные аспекты

Расширение издательских возможностей библиотеки при внедрении сетевых технологий. Электронная библиотека – не только организатор доступа к удаленным ресурсам, но и производитель собственных электронных продуктов, предоставляемых в пользование широкой публике: конвертированные материалы из печатного фонда, электронные версии собственных публикаций, «гостевые материалы» (пример совместной работы ГПНТБ России и Университетской и технической библиотеки г. Ганновера, Германия (TIB/UB)). Участие библиотек в наработке электронного ресурса. Собственные вебсайты библиотеки, проблемы поддержания вебсайта, краткое объяснение понятия «аутсорсинга». Примеры реализации технологии «аутсорсинга» в российских библиотеках.

Конверсия печатного материала в цифровой формат (оцифровывание, оцифровка). Сканеры, цифровые фотоаппараты, цифровые видеокамеры. Сканирование. Планшетные, барабанные, планетарные сканеры, их предназначение и особенности. Автоподача и технология обработки в промышленных масштабах. Параметры известных моделей планетарных сканеров. Меры по обеспечению сохранности печатного материала при сканировании, компенсация искажений и случайных загрязнений.

Суть процесса сканирования. Формат записи сканированного материала. Универсальный по отношению к аппаратной платформе (к типу компьютера) формат TIFF. Пространственное разрешение сканера. Количество точек на дюйм (dpi). Объем памяти для записи отсканированного материала. Различия в используемых настройках для конверсии разных видов ресурсов (печатного текста, чертежей, графиков, рукописей, фотографий, изображений). Требования к компьютеру и программному обеспечению. Системы компрессии цифрового массива, краткие сведения о формате JPEG. Оптическое распознавание букв (символов), преимущества и недостатки.

Цифровая съемка и другие средства создания электронных ресурсов. Возможность использования электронных массивов, создаваемых в ходе подготовки печатной публикации.

Сравнение стойкости, долговечности таких видов информационных ресурсов, как печатные, электронные, устные; потребность в стандартизации.

Перечень и характеристика возможных причин потерь информации. Принципы организации службы и технологии хранения документов и данных в ЭБ, а также доступа к архивам. Программные средства и программно-технические комплексы (в том числе технологии семейства RAID, программы-архиваторы, форматы сжатия и их характеристики). Проблемы обеспечения безопасности хранения, передачи, получения и обработки информации. Технологическое обеспечение надежности хранения информации; скорость доступа и темп передачи данных из архивов; долговечность хранения и устойчивость к миграции программных и аппаратных средств.

Проблема обеспечения бесперебойного питания и «горячего резервирования» содержания библиотечных серверов; создание технологических и страховых резервных копий; связь данных технических проблем с режимами работы электронных библиотек и обслуживания пользователей. Особая значимость круглосуточной работы для электронных библиотек.

Виртуальные хранилища как новый вид платных информационных услуг, появившихся в Интернете (физически – хранение информации другого владельца на сетевом сервере данной организации).

Практическое занятие 5 по теме лекции посвящено работе с Интернет-ресурсами по образованию, в частности с вебсайтами www.informica.ru (Министерство образования и науки Российской Федерации), www.actr.org (Американские советы по международному образованию), с вебсайтами известных российских и зарубежных университетов и ряду других предлагаемых преподавателем.

Контрольные вопросы к Разделу 2

  1. Определение электронных ресурсов.
  2. Определение электронного документа.
  3. Определения электронной публикации и электронных
    ресурсов
    .
  4. Свойства электронных ресурсов, отличающие их от печатных материалов.
  5. Виды электронных ресурсов по общественному назначению.
  6. Типы электронных документов.
  7. Что такое мультимедийные ресурсы?
  8. Основные форматы записи текстовых документов и изображений.
  9. Способы визуализации электронных ресурсов.
  10. Технические средства – носители электронной информации.
  11. Преимущества жесткого диска по сравнению с магнитными лентами, проявляющиеся при обработке информации.
  12. Основные параметры оптического компакт диска.
  13. Хранилища электронных ресурсов.
  14. Электронные каталоги и базы данных.
  15. Электронные книги.
  16. Электронные полнотекстовые журналы.
  17. Основные способы создания электронных документов.
  18. Меры по обеспечению сохранности электронных ресурсов.
  19. Сканирование и электронные форматы.

На главную  |  Полнотекстовый поиск  |  Сайт ГПНТБ России  |  Оформление подписки  |  Архив