РЕСУРСЫ ЭЛЕКТРОННЫХ БИБЛИОТЕК: ОПРЕДЕЛЕНИЯ, ВИДЫ РЕСУРСОВ, СОЗДАНИЕ, КОМПЛЕКТОВАНИЕ, ХРАНЕНИЕ ЭЛЕКТРОННЫХ РЕСУРСОВ
(темы лекций 3, 4, 5, 6, 7)
Теоретическая база Раздела 2
Вводные части данного раздела опираются на теоретические разработки по документоведению, фондоведению и информационным ресурсам, сформулированные и развитые учеными ГПНТБ России, МГУКИ, Российской государственной библиотеки, научно-технического центра «Информрегистр» и других библиотек и научных центров, ведущих исследования в этой области. Принципиальных гносеологических различий в понятия «документ» и «электронный документ», «публикация» или «электронная публикация» нами не вносится. Детальная типология электронных ресурсов опирается на их имманентные свойства дискретность, машиночитаемость и др. Тем не менее, мы рекомендуем студентам придерживаться следующего определения понятия «электронный документ», чтобы избежать разночтений и неточностей: «электронный документ это законченный по содержанию массив информации, зафиксированный машиночитаемым образом на материальном носителе».
Весьма кратко излагаются технологические основы записи информации; мы исходим из того, что данный материал студентам уже знаком по другим курсам, в частности из курса «Информатика».
Развитие конкретных видов электронных ресурсов дается в историческом аспекте от электронных каталогов, библиографических и реферативных баз данных до полнотекстовых и мультимедийных материалов. Современные подходы к созданию и экономному использованию справочно-поискового аппарата (будь-то каталогизация документов или объединенные системы метаданных для издательств, книготорговли, способные к восприятию в библиотеках) рассматриваются нами как вероятные направления развитие этого вида библиотечных технологий. Следует коротко представить наиболее известные системы метаданных, в первую очередь, Дублинское ядро (Dublin Core), которая сегодня принята в качестве нац. cтандарта в ряде стран, MARC библиографические форматы, самые распространенные и общепринятые в мире, ONIX формат описания товара в системах электронной книжной торговли, LOM, GILS и ряд других.
Особое место отведено рассмотрению электронных книг (e-books) как специфического вида потенциально интересных библиотечных ресурсов, уже достаточно распространенных на Западе, способных содействовать обслуживанию пользователя вне стен библиотеки; это же носитель может быть полезным при распространении учебно-методических материалов.
Экономические проблемы записи и хранения информации даны на примере компактных оптических дисков CD-ROM. Опираясь на концепцию так называемого жизненного пути издания проведено сравнение экономических показателей обслуживания для традиционной и электронной технологий.
Лекция 3. Электронные ресурсы: определения, типология и характеристики
Настала эпоха электронных публикаций, но это вовсе не означает, что прошло время для печатных публикаций (до сих пор 90% всех документов существуют на бумажных носителях). Эти технологии сосуществуют и будут сосуществовать так же, как уживаются вместе драматический театр и кинематограф, телевидение и кино, Интернет и телевидение. По мере появления новой технологии расширяются возможности, полнота раскрытия материала и детальность восприятия пользователя.
Все еще существует некоторая условность определения «электронные ресурсы», хотя определения «электронный документ» и «электронное издание» («электронная публикация») четко сделаны с акцентом на машиночитаемость данного вида ресурсов. Термин «машиночитаемость» взят в качестве устоявшейся в русском языке кальки с английского Machine Readable откуда пошли хорошо известные аббревиатуры для библиографических форматов MARC (Machine Readable Cataloguing) хотя, конечно, в данном случае речь идет о пригодности указанных ресурсов к обработке на персональных компьютерах без какой-либо дополнительной подготовки.
Определение: Электронные ресурсы это совокупность электронных документов, образованная преднамеренно или в результате случайных действий или событий.
Виды электронных документов (типология)
Свойства электронных ресурсов. Базисные свойства электронных ресурсов:
машиночитаемость;
дискретность, конечность и счетность массива данных;
однородность массива данных безотносительно характеристик отражаемого объекта (черно-белое или цветное изображение, одномерный или многомерный объект, подвижный или покоящийся объект, текст или звук и т.п.);
зависимость от программно-аппаратного обеспечения для их использования;
способность к совмещению разнородной информации (мультимедиа);
способность к клонированию, то есть к созданию абсолютно идентичных (в принципе неразличимых) копий оригинального цифрового документа;
неиссякаемость при копировании;
возможность дистанционного управления электронными ресурсами (обработка, копирование, пересылка и т.д.);
неодинаковая чувствительность к появлению ошибок в записи: заведомая избыточность данных некоторых массивов (например в музыкальных файлах, в записи изображений) и в то же время уязвимость к появлению любой ошибки или неточности в некоторых критических местах (например, в компьютерных программах, системах управления базами данных, Интернет-адресах и т.п.);
возможность организации самоконтроля и устранения ошибок в массивах данных;
уязвимость по отношению к зловредным действиям со стороны других электронных документов (например, со стороны вирусов).
Классификация электронных ресурсов по их отношению к печатным ресурсам:
электронные ресурсы, не имеющие печатных аналогов (электронная почта, домашние страницы и другие материалы вебсайтов, дискуссионные группы в Интернете, некоторые научные и популярные журналы, базы данных, мультимедийные материалы, специфические виды рекламы, вирусы и т.п.),
электронные ресурсы, созданные для поддержания имеющихся печатных ресурсов, например, для обеспечения сохранности или расширения и улучшения обслуживания пользователей (в частности, организация мультидоступа для спрашиваемых изданий), и подлежащие долговременному хранению (электронные книги, цифровые версии печатных документов и т.п.),
электронные ресурсы, создаваемые на короткий срок в технологических целях на основе печатных ресурсов и не предназначенные для долговременного хранения или подлежащие уничтожению после однократного использования (копии материалов, используемых в системе МБА и доставки документов в библиотеках, электронные справки, квитанции и т.д.).
незаменимые (пока!) виды печатных документов (грамоты, награды, паспорта, водительские права, бумажные деньги и т.п.); симбиоз печатных и электронных документов: кредитные карты, магнитные пропуска и билеты с магнитной записью.
Основные типы электронных ресурсов с указанием отличий от традиционных документов:
полнотекстовые документы, электронные журналы с возможностями поиска, наличием гиперсвязей, и автоматического агрегирования;
таблицы с расширенными функциями обработки данных и демонстрации результатов (спрэдшиты);
библиографические, реферативные, адресно-справочные, фактографические, полнотекстовые и иные базы данных с возможностями поиска, библиотечные электронные каталоги различных типов и библиографические указатели;
рисунки и изображения с возможностями обработки файлов по размерам, цвету, пространственным параметрам изображения и построения многомерных изображений;
аудиозаписи и музыка, видео, компьютерная анимация;
цифровые карты и картографическая информация;
компьютерные программы, в том числе программы и команды непосредственного исполнения;
вирусы и им подобные типы зловредных компьютерных программ;
мультимедийные материалы (совмещение разных видов ресурсов, например, текст и звук; текст, изображение, звук; текст и анимация и т.д.),
агрегированные подборки, изготовленные «на лету», автоматическим методом;
другие.
Общее представление о мультимедийных ресурсах как о перспективном виде электронного ресурса
Примеры известных отечественных мультимедийных и обучающих систем на CD-ROM (рис. 1114).
Рис. 11. Энциклопедия "Мир вокруг нас" на
CD-ROM
Рис. 12. Большая энциклопедия Кирилла и мефодия (на 8
CD-ROM)
Рис. 13. Энциклопедия создания и развития космической
индустрии
в России "Русские в космосе" на CD-ROM
Рис. 14. Интерактивный учебный комплекс
"Электронные библиотеки" на CD-ROM
Мультимедийные ресурсы более детально освещены в курсе «Мультимедийные технологии», также читаемом студентам данной и других специализаций.
Виды электронных ресурсов по общественному назначению: научные, образовательные, библиотечные и развлекательные материалы, художественная и научно техническая информация, СМИ (новости, ТВ), объявления, реклама, пропаганда, электронная коммерция, производственная, технологическая и финансовая информация, системы автоматизации экспериментов, проектных работ, производства, другое.
Виды электронных ресурсов по степени доступности: бесплатные, условно бесплатные, платные, закрытые для публичного доступа, в том числе закрытая и/или конфиденциальная информация (режимно-секретная), коммерческая, промышленная и технологическая информация, финансовые и налоговые сведения, частная жизнь. Следует отметить существующее различие в российском и международном толковании понятий «публичная информация» и «конфиденциальная информация». Примеры адресов вебсайтов с информацией о защите частной жизни приводятся на практическом занятии 1. Обработка электронных текстов: необходимо знать основные (по названиям) кодировки кириллического и латинского алфавитов, коды ASCII, ISO, UNICODE, таблицы ISO и таблицы Библиотеки Конгресса США для представления кириллических алфавитов. Отечественные стандарты и вводная информация по системе СИБИД. Разметка текстов: обогащенный текстовый формат, формат документа с версткой и встроенной графикой, языки разметки SGML, HTML, XML. Обработка электронных ресурсов изображений; простой формат изображения. Некоторые примеры других форматов: гипертекстовый формат, формат баз данных, форматы для фотографии и музыкальных файлов примеры из Интернет. Отличия и предпочтения, некоторые рекомендации по выбору и использованию. Рекомендации по изучению языка HTML, отсылка к специализированным руководствам, разработанным в последние годы, в том числе и сотрудниками кафедры [5, 6, 38].
Практическое занятие1 по теме лекции 3 (три учебных часа). Ознакомление с общим состоянием дел в области российских электронных ресурсов, роль государственных центров, «Закон об обязательном экземпляре». Практическая работа в Интернете по выбранной тематике российских электронных ресурсов (например, по материалам лекции 12).
Лекция 4. Электронные ресурсы: типология и технические характеристики носителей информации
В лекции дается общее представление о технических средствах носителях электронного ресурса. Сервер достаточно мощный компьютер, совместимый с персональными компьютерами, средство хранения и обработки электронных ресурсов. Типовой состав локальной вычислительной сети (ЛВС): сервер, персональные компьютеры, средства коммуникации.
Краткое описание физических принципов записи (фиксирования) информации
Классификация носителей информации по физическим характеристикам.
Физические основы записи цифровой информации:
оптические свойства: проницаемость для света (перфокарты); светоотражающая способность (оптические компакт-диски);
изменения электрической проводимости: открытое или закрытое положение транзистора;
изменения намагниченности (магнитные ленты);
изменения квантовых параметров;
другие параметры.
Форма носителя: диски, ленты, плоские платы памяти микросхемы. Среда записи и считывания информации: магнитные носители, оптические носители, смешанные магнитооптические носители, платы памяти микросхемы.
Физический носитель информации на сервере локальной вычислительной сети (ЛВС), Интернет-сервере и в любом персональном компьютере (жесткий диск) система, состоящая из набора вращающихся на одной оси плоских дисков диаметром несколько сантиметров, покрытых магнитным слоем. Эксплуатационные свойства жесткого диска: большая емкость, быстрый доступ к записанной информации, высокий темп считывания информации и взаимозаменяемость (стандартизация дисков). Быстрый доступ к информации обеспечивается небольшим расстоянием, которое проходит считывающая головка при поиске нужного места, а также записью информации в предварительно созданные (отформатированные) секторы на диске.
Технические особенности, обеспечивающие малый износ головок и магнитного слоя поверхности пластины. Для ресурса сервера опасно не количество отработанных часов, а число включений, связанных с «посадкой» головок и разгоном дисков. Указанная особенность конструкции сервера дает возможность при наличии устройств бесперебойного питания оставлять сервер включенным в течение многих суток (недель). Таким образом достигается одно из существенных преимуществ электронной библиотеки обслуживание пользователя 24 часа в сутки круглый год. Оптимизация структурной схемы локальной сети, размещение устройств, защищающих от несанкционированного доступа межсетевых защитных экранов.
Носители информации на магнитных лентах, их преимущества: освоенные технологии производства и высокая плотность записи, высокая скорость считывания информации и большая емкость. Неустранимый недостаток магнитных лент большое время доступа к информации, «пульсирующий» (а не равномерный) характер эксплуатации, постепенное стирание магнитного слоя, ухудшение записи из-за размагничивания ленты, вытягивание ленты-основы в ходе эксплуатации. Цифровые устройства хранения информации: стримеры, ленточные накопители емкостью до 100 Гбайт, цифровые хранилища роботизированные библиотеки с суммарной емкостью 10 Терабайт, темпом передачи данных до 10 Мбайт/сек.
Другие физические носители информации: компактные оптические (или магнитооптические) диски. Диски «только для чтения» CD-ROM с предварительно записанной и неизменяемой информацией. Основы конструкции оптического компакт-диска, стандарты, главные преимущества и недостатки. Встроенные в компьютер устройства с возможностью ускоренного вращения диска. Отдельные хранилища на 50100 дисков с механической подачей диска на считывание; специальные системы, допускающие одновременное считывание с нескольких дисков. Технология двусторонних дисков высокой плотности записи DVD.
Встроенные устройства записи информации на оптические диски CD-WR (однократной записи), CD-R (многократной записи) как дополнение штатного жесткого диска компьютера. Семейство перезаписываемых дисков, перспективных для использования в работе библиотек и центров информации: DVD-RW (1 тыс. перезаписей) и DVD-RAM (100 тыс. перезаписей). Рыночная роль традиционных компакт дисков CD-ROM иллюстрируется Табл. 2.
Вспомогательные носители информации: гибкие диски 1,44 Мб, переносные жесткие диски, устройства типа Flash емкостью до 2 Гбайт, карты памяти для цифровых камер, аудиоплейеров. Ноутбуки, субноутбуки, карманные персональные компьютеры («наладонники») и т.п.
Принципиальное изменение концепции целесообразности применения портативных устройств всвязи с развитием Интернет и мобильной связи.
Таблица 2
Рыночная роль различных типов аудио видео дисков (количество и объемы продаж в мире в 2003 году, данные Американской ассоциации звукозаписи, Recording Industry Association of America)
No
Тип аудио диска
Количество проданных
дисков, штук
Объем продаж,
долларов
1
Музыкальные CD
745 900 000
11 232 900 000
2
Усовершенствованные компакт-диски SACD
1 300 000
8 000 000
3
Виниловые долгоиграющие
пластинки
1 500 000
21 700 000
4
Audio DVD
400 000
26 300 000
Сравнительная экономика хранения цифровых данных на различных видах носителей приведена в Табл. 3 (данные по состоянию на 2001 г.).
Таблица 3
Сравнительная стоимость хранения массива данных объемом 1 Мегабайт на различных видах носителей
Носитель
Стоимость (долл.)
Кратность стоимости в сравнении с CD-ROM
Бумага
5.00
х 2000
Жесткий диск
1.65
х 660
Микрофиша
0.76
х 304
Гибкий диск
0.42
х 168
Стриммер (лента 9 дорожечная)
0.25
х 100
Магнитооптический диск
0.19
х 76
Выносной (портативный) жесткий диск
0.12
х 48
WORM
0.10
х 40
CD-R
0.32
х 13
Стриммер (DAT)
0.015 0.01
х 6-4
CD-ROM
0.0025
х 1
Семинар по теме лекции 4 посвящен обсуждению типологии электронных ресурсов, особенностям доступа, форматам записи и хранения электронных ресурсов. Обсуждаются понятия и примеры баз данных, электронных каталогов, электронных книг, полнотекстовых электронных журналов. Для обсуждения также предлагаются стоимости оценки хранения электронных данных на различных носителях (Табл. 5).
Практическое занятие2 по теме лекции 4 направлено на предоставление возможности студентам самостоятельно работать с Интернет-ресурсами по науке и технике, аннотированными Библиотекой Конгресса США, Московским государственным университетом, Техническим университетом г. Берлина, Российской государственной библиотекой, Еврейским университетом в г. Иерусалиме, Британской библиотекой, а также с рядом баз данных на CD-ROM по научно-техническому профилю «Science Citation Index», INSPEC, «Chemical Abstracts», «CREY Literature» (ГПНТБ России), электронным каталогам БЕН РАН, ЦНСХБ, ГПНТБ России, ГПНТБ СО РАН, отражающих отечественные ресурсы по науке и технике, кооперативным системам публичных и вузовских библиотек в (первую очередь корпоративной сети московских библиотек (КСМБ) и ряду других.
Лекция 5. Электронные ресурсы: каталоги, базы данных, графические материалы, электронные книги
Определение электронной публикации. Доступность электронной публикации. Мультидоступ
Определение: «Электронная публикация машиночитаемый документ, преднамеренно созданный для ознакомления с ним неограниченного круга лиц и обеспеченный для этого средствами доступа». Определение «Электронные публикации» не подразумевает участие электронов или электронной структуры вещества в создании или пользовании этими материалами, как иногда пытаются толковать студенты, проявляющие свою эрудицию. Роль электронов в работе с электронными публикациями ничуть не более, чем в работе с печатным публикациями (пример тому перфокарты, на которых записывается цифровая информация).
Примеры первых электронных ресурсов: электронные каталоги, библиографические, реферативные и фактографические базы данных; электронные книги, электронные полнотекстовые журналы.
Определение: «База данных (БД) тематически собранный и структурированный массив информации, состоящий из большого набора однотипных элементов». Число элементов («записей») от сотен до нескольких миллионов. Каждый из элементов БД имеет одинаковую структуру (состоит из одинакового набора «полей» или «областей»). Число полей от 2 до сотни и более, в зависимости от характера использования базы данных. Заполнение некоторых полей может быть обязательным, а некоторых факультативным; поля могут делиться на подполя. Размер отдельной записи может быть ограничен каким-то количеством знаков или слов. Основное свойство БД возможность проводить поиск информации и другие действия по любым выбранным полям или по их произвольной комбинации.
Одной из наиболее значимых компонент систем библиотечной автоматизации и одновременно специальной БД является электронный каталог библиотеки. Электронный каталог главный продукт библиотечной автоматизации и обеспечение доступа к нему, во многом определяет эффективность последней. Каталогизация текущих поступлений, в том числе методом заимствования («корпоративная каталогизация»); ретроспективная конверсия как средство улучшения доступности депозитарных или архивных материалов. Представлен Сводный каталог как средство использования распределенного библиографического и адресно-справочного ресурса; приводятся примеры Сводных каталогов в России и за рубежом; оцениваются предпосылки к устойчивому функционированию системы использования распределенных ресурсов и применение технологий ЭБ в этих целях. На практических занятиях отрабатывается поиск в Российском Сводном каталоге научно-технической литературы (www.gpntb.ru), демонстрируется доступ к другим российским и зарубежным Сводным каталогам. Представляются образцы записей баз данных Сводного каталога НТЛ.
Из общего объема продаж 1 700 млн евро НТМ публикаций в 2002 году 42% приходится на сетевые продукты; лидируют компании Эльзевир, Клювер и Томсон. В 20032004 гг. ситуация не изменилась.
Таблица 4
Изменения доли (процент объема продаж) традиционных и сетевых продуктов на Европейском рынке научно-технической и медицинской информации (по данным исследовательской компании IRN)
Формат
Годы
2000
2001
2002
2003
Сетевые продукты
(online)
31%
32%
42%
46%
Традиционные
продукты (hard copy)
69%
68%
58%
54%
Таблица 5
Основные поставщики сетевых продуктов на европейском рынке научно-технической и медицинской информации (результаты анкетирования 110 специалистов Великобритании, Германии, Франции, проценты пользователей данного продукта)
No
Наименование сетевого продукта, компания
Процент респондентов, пользующихся данным продуктом
1.
Science Direct (Elsevier)
56%
2.
Web of Knowledge (Thomson)
43%
3.
Springer Verlag
34%
4.
Wiley Interscience
30%
5.
Ovid/Silver Platter
25%
6.
Kluwer Online
24%
7.
Cambridge Scientific Abstracts, CSA
21%
8.
STN (FIZ Karlsruhe)
17%
9.
INIST-CNRS
17%
Основная часть пользователей STN находится в Германии, а пользователей INIST-CNRS во Франции. Для Эльзевира продажи Science Direct приносят 75% дохода от подписки, для компаний Thomson и Wiley сетевые продукты приносят более 60% дохода. 90% опрошенных начальные этапы работы в сети проводят с бесплатными источниками, и только на завершающей стадии обращаются к поставщикам платной информации.
Краткое знакомство с семействами форматов библиографического описания MARC (Machine Readable Cataloguing) как основы межбиблиотечного и международного взаимопонимания и совместного использования библиографических ресурсов: MARC-21, UNIMARC, RUSMARC их сходства и отличия. (Детальное изучение библиографических машиночитаемых форматов с 2001/2002 учебного года дается в учебном курсе «Информационное обеспечение АБИС», читаемом на кафедре информационных технологий и электронных библиотек МГУКИ.)
Отдельно рассматривается использование в библиотеках корпоративных и коммерческих баз данных каталогизации, основные сведения о корпоративных системах OCLC/PICA, RLIN. Поисковые протоколы Z39.50, HTTP; основные преимущества и недостатки. На рис. 15 приведены примеры записей Российского Сводного Каталога по научно-технической литературе (держатель ГПНТБ России, объем около 650 тыс. записей), а на рис. 16 главная страница вебсайта OCLC крупнейшего в мире онлайновой библиографической системы и центра корпоративной каталогизации, содержащей Мировой Сводный Каталог (World Cat около 50 млн записей). На рис. 17, 18 приведены примеры двух известных систем OCLC. В целом OCLC уникальный пример современного воплощения информационных технологий в практике библиотечно-библио-графической деятельности, в создании электронных библиотек. Известная американская корпорация OCLC(Online Computer Library Center) была создана в 1967 г. как библиотечный онлайновый центр, объединивший деятельность колледжей штата Огайо (Ohio College Library Center та же аббревиатура OCLC), и позволила 54 колледжам штата обмениваться информационными ресурсами, сократив свои финансовые затраты на каталогизацию и улучшив доступ к библиотечным фондам. На 01.01.2005 г. услугами OCLC пользуются более 50,5 тыс. библиотек из 95 стран мира.
Профессиональная деятельность OCLC нацелена на совершенствование всеобщего доступа к международной инфор-мации, как для научно-образовательной деятельности, так и для сокращения расходов в библиотечной деятельности. Члены OCLC обязаны выполнять текущую каталогизацию в режиме онлайн или передавать данные на магнитных носителях. При этом они получают дополнительные возможности по услугам корпорации для обычных своих пользователей. Для библиотек-партнеров OCLC служит богатым источником разнообразных готовых библиографических записей, и представляет возможность их заимствования. По данным опроса партнеров пользователи в среднем находят в каталоге информацию на более чем 94% документов, которые они каталогизируют.
Возможности создания, развития и поддержки устойчивой работоспособности средств телекоммуникации в библиотеках, объединенных корпоративной деятельностью способствует расши-рению этих направлений работ.
Очень важной характеристикой деятельности OCLC является наличие развитой структуры служб, в число которых входит служба Сводного каталога WorldCat, служба каталогизации, служба МБА, служба ретроспективной конверсии и другие службы.
В лекции и в особенности в практических занятиях проводится закрепление результатов поиска, составление свода указателей полезных адресов типа автоматизированных «Книжных закладок».
Полезным оказывается изучение сайта OCLC (www.oclc.org).
Краткая информация о метаданных. Метаданные это информация об информации, описание электронных ресурсов общепринятым рекомендациям, наиболее распространенными среди которых являются протокол Dublin Core (Дублинское ядро) для основных сетевых ресурсов), vCard (для персоналий и обмена данными о них), iCalendar (для обмена данными о последовательности событий, календарях и т.д.), Z39.87 (для неподвижных цифровых изображений), PDM (для описания проектов как информационных объектов), АВС (для облегчения интероперабельности между онтологиями метаданных в различных доменах), СС/РР (для адаптации контента интернета к аппаратной платформе пользователя), EAGLES (для связей между смыслами слов, для принципов EAGLES-стандартов в области лексики и семантики), ISO 6523 (для создания набора данных, связанных с организациями), ISO 810 (транспортный протокол OSI), ISO 11179 (для описания элементов данных в базах данных и документах), METS (для обмена метаданными между библиотеками), MREG-7 (для описания мультимедийных данных), MREG-21 (для идентификации и управления объектами мультимедийных презентаций), OIL 9 (для описания терминов онтологии, объектами мультимедийных презентаций), OIL 9 (для описания терминов онтологии, их ограничений и взаимосвязи), OIM (для моделирования метаданных), OWL (для представления терминов словарей и взаимосвязей между ними).
Кроме общих форматов существует большое число специализированных метаданные для архивов, MARC для обмена библиографической информацией, для геогафической, медицинской, музейной, экологической, экологической, научной, новостной информации, для дистанционного образования, а также административные метаданные.
Для библиотек наиболее известным набором элементов метаданных является так называемое Дублинское ядро (Dubline Core, DC) используемое для описания разнообразных ресурсов, доступных в Интернет и иных сетях. Стандартизованы пятнадцать элементов Дублинского ядра, которые условно подразделяются на три группы (все элементы не являются обязательными и могут повторяться):
элементы, относящиеся к описанию содержания ресурса (заглавие, предмет, описание, источник, язык, отношения, зона действия);
элементы, относящиеся к интеллектуальной собственности (автор, издатель, сведения об ответственности, правовые аспекты);
элементы, относящиеся к данному экземпляру ресурса (дата, тип ресурса, формат, идентификатор), представлена также 4-уровневая модель произведения ИФЛА.
Другие системы метаданных:
EAD кодировка архивных описаний,
GILS глобальная служба поиска информации,
EDIFACT коммерческая документация и другие. Разработка систем идентификации электронных документов (DOI), ONIX новый подход к коммуникативным форматам для описания электронных транзакций книготорговли.
Базы данных научно-технической, экономической и финансовой информации, краткое знакомство с основными системами. Отечественные производители баз данных ВИНИТИ, ГПНТБ России, РГБ, ВНТИЦентр, ВИМИ, Росинформресурс, ГПНТБ СО РАН, Гарант, Росбизнесконсалтинг, ИнтегрумТехно. Зарубежные базы данных (Compendex, Inspec, Medline, CAS, STN, SIGLE и др.), производители и поставщики информации и баз данных ISI, Thomson, Derwent, Dialog,INIST, OCLC, EBSCO, Elsevier. Национальная регистрация баз данных, роль и значение научно-технического центра «Информрегистр» в описании и сохранении информационных ресурсов.
Примеры организации работы библиотек с электронными ресурсами: начальный этап поиска в бесплатных сетевых источниках и затем переход к коммерческим поставщикам.
Услуги и продукты на основе электронных ресурсов: базы данных оглавлений (таблицы содержания) научных журналов; службы агрегирования, обеспечивающие единую отправную точку, единый пароль и адресацию в сети. Возможность присоединять собственные продукты и базы данных (данные из электронного каталога библиотеки, библиографические базы данных и т.п.). Система ссылок CrossRef, допускающая многовариантный вход пользователя в систему (из базы данных, из сети, от какой-либо собственной страницы) с переходом в основную базу данных через название журнала, определенного номера выпуска или отдельной статьи.
Электронные книги (e-books) как самостоятельный вид платных электронных ресурсов; отличие электронных книг от электронных текстов, основные технологические схемы и системы обслуживания. Примеры использования электронных книг в библиотеках (опыт публичной библиотеки им. Фергюсона в г. Стэнфорд, Коннектикут, США). Электронные книги в Интернет новая технология; сопоставление с технологиями обслуживания электронными полнотекстовыми журналами. Сравнение технологии поставки информации в виде электронных книг кассетно-картриджного типа с поставкой информации через Интернет.
Визуализация электронных документов:
просмотр на компьютерных мониторах;
проецирование на большой экран;
распечатка, в том числе клонирование оригинального печатного издания;
специальные виды воспроизведения для слабовидящих.
Новое технологическое направление формирования привычного для читателя печатного формата в сочетании с возможностями современных компьютерных технологий на базе углеродсодержащих микрокапсул («электронные чернила», e-ink).
Практическое занятие3посвящено самостоятельной работе студентов на планшетных сканерах по сканированию графической и полнотекстовой информации, ее сохранению и распознаванию. Первый опыт работы с программой распознавания кириллических текстов ABBYY Fine Readerна основе предложенных преподавателем примеров фрагментов библиографических указателей и картинок печатного каталога.
Лекция 6. Электронные ресурсы: комплектование фонда и обслуживание полнотекстовыми электронными журналами
Полнотекстовые научные журналы в различных форматах; рост числа и роли электронных журналов; электронная версия печатного формата (чаще всего формат .pdf, который повторяет изображение печатной страницы). Важность лицензирования и регистрации разрешенных пользовательских групп, особенно в контексте усиления контроля за соблюдением авторских прав.
Ключевая роль библиотекаря при отборе электронных ресурсов для читателей библиотеки. Проблемы обслуживания спрашиваемых изданий печатными копиями из-за ограниченного количества экземплярности. Комплектование зарубежной печатной литературой заметно уменьшилось и по финансовым причинам, и из-за постоянного повышения интереса пользователей к электронным ресурсам, однако возможность доступа к знанию не сократилась из-за появления электронных изданий. Оценки объемов доступной для пользователя информации в традиционном и в электронном формате.
Преимущества электронных журналов: не занимают много места, обеспечивают легкость коммуникации, немедленную доставку информации на письменный стол, снабжены мощным поисковым аппаратом, дают возможность работать с интегрированным текстом, использовать гиперсвязи и мультимедиа, обеспечивают возможность сетевого множественного доступа к материалу одновременно многим пользователям (в соответствии с конкретной лицензией). Мультидоступ как одно из главных преимуществ электронных публикаций перед печатными, особенно в условиях недостаточной экземплярности печатных документов при имеющемся спросе; это преимущество и позволяет многим библиотекам постепенно замещать традиционную подписку на печатные журналы на покупку лицензий для обеспечения доступа своих читателей к полнотекстовым электронным журнальным коллекциям.
Трудности и препятствия на пути применения электронных журналов: обеспечение доступа к изданиям прошлых лет, долговременная архивация, сложные бюрократические проблемы подготовки контракта на лицензирование, стоимость электронных журналов, требование лицензии работать (предоставлять доступ к электронным материалам) в заранее согласованном месте с привязкой к определенному физическому адресу в Интернете, необходимость каждый раз (для каждого наименования журнала) заново переписывать лицензионное соглашение и вести переговоры по нему, неготовность ряда спрашиваемых изданий открыть подобный сервис.
Наибольшую значимость для пользователя имеют: бесплатное тестирование; возможность иметь более детальные описания, методические наработки.
Важные особенности: коллективная подписка (консорциум) и распределенный ресурс, оформление многолетних пользовательских лицензий. Переход от ссылки в конце статьи к полному тексту статьи, на которую сослались, вне зависимости от того, где и кем она публиковалась, например, система перекрестных ссылок CrossRef, которая обеспечивает взаимосвязанный доступ к миллиону статей из нескольких тысяч наименований журналов. Примеры электронных полнотекстовых журналов. Опыт работы российских библиотек с научной электронной библиотекой РФФИ; опыт работы московского консорциума публичных библиотек.
Работа библиотек по формированию систем коллективной подписки с предоставлением доступа к электронным версиям. Стоимость электронных журналов, оценка экономики и сравнение со стоимостью подписки печатных изданий.
Интересные факты единой комбинации электронной и печатной версии, при этом стоимость электронной версии нарочито никак не выделяется. Комбинация электронной и печатной версии, при которой за поставку электронного варианта сверх стоимости одной печатной версии взимается дополнительно от 8 % до 65 % .
Независимая подписка на электронную версию по цене, варьирующейся от 65 % до 150 % от стоимости подписки на печатную версию.
Особый вид библиотечных консорциумов, объединенных идеей совместной подписки на электронные издания. Специальные цены для консорциумов. Что такое консорциумы (корпоративные системы); примеры, опыт объединения в консорциумы российских библиотек. Общие черты: некоторая наценка (надбавка) на стоимость печатной версии дает пользователям возможность получать доступ к электронным версиям всех изданий, включенных в соглашение о консорциуме, а иногда и ко всем публикациям данного издательства; за базовую берется цена подписки на печатную версию; соглашение заключается как правило на три года; иногда дается скидка, пропорциональная количеству библиотек участники консорциума; иногда за базовую берется стоимость подписки на электронную версию, при этом печатная дается с большой скидкой.
Метод поставки отдельных статей (метод «плати за просмотр»); стоимость отдельной статьи варьируется в зависимости от поставщика, от категории пользователя и от срочности выполнение заказа от 10 до 43 долларов. Опыт систем First Search OCLC, Subito и STN International.
Взимание платы за публикацию с авторов, а не с библиотек или читателей, например, опыт Нового физического журнала (New Journal of Physics) и ряда других. Отдельно изучается опыт работы ГПНТБ России по обслуживанию читателей электронными журналами и опыт предоставления услуг OCLC.
Иные методы ценообразования:
пакет из всех электронных публикаций данного издателя, при этом по желанию поставляется и печатная версия;
модель, учитывающая количество штатных сотрудников в учреждении, либо количество лиц, одновременно пользующихся электронными материалами, либо число станций доступа к Интернету;
дополнительная плата за поставку программного обеспечения;
объединение доступа к содержанию публикаций разных издателей.
Другие проблемные вопросы, рассматриваемые в данной лекции:
создание единого интерфейса, единых точек доступа;
формирование связей между библиографическими данными и соответствующими полными текстами;
контроль аутентичности пользователя (проверка его права доступа к различным видам ресурсов) и создание централизованной системы контроля платежей в режиме онлайн;
посредничество между консорциумами и издателями; консультации и помощь в лицензировании и оплате, поставка готовых информационных систем «под ключ»;
обучение и переподготовка библиотекарей и пользователей;
помощь издателям при подготовке Интернет-публикаций;
формирование архивов электронных ресурсов.
В Российской Федерации зарегистрировано 30 тыс. печатных СМИ; выходят около 12 тыс., на рекламном рынке присутствуют около 1,5 тыс., но лишь всего 122 издания сертифицируют свой тираж (в том числе «Независимая газета», «Комсомольская Правда», «За рулем», «Мир ПК» и др.), остальные часто вводят в заблуждение своих подписчиков. Утрачен механизм репутации, поэтому российское общество (57% граждан по недавней оценке) согласилось бы с введением цензуры. Хотя совершенно непонятно как это можно увязать со свободой печати и доступа к информации основополагающим составляющим информационного общества и будущего общества знаний.
По данным Национального Института прессы, в России около 1200 регулярно обновляемых электронных изданий, из них 2/3 имеют печатную версию; более консервативные оценки около 300 Интернет-СМИ.
Практическое занятие4 по теме лекции посвящено продолжению обучения студентов навыкам работы по сканированию полных текстов и графики; но уже на планетарном сканере, в том числе и с системой распознавания кириллицы ABBYY Fine Reader. Для успешно освоивших эту технологию в часы практического занятия предлагается самостоятельная работа с одной из известнейших онлайновых систем баз данных First Search OCLC, включая и доступ к полным текстам (если нет возможности обеспечить эту технологию, возможной альтернативой может быть работа с базами полнотекстовых данных Elsevier, EBSCO или других компаний).
Лекция 7. Создание и обеспечение сохранности электронных ресурсов; технологические и организационные аспекты
Расширение издательских возможностей библиотеки при внедрении сетевых технологий. Электронная библиотека не только организатор доступа к удаленным ресурсам, но и производитель собственных электронных продуктов, предоставляемых в пользование широкой публике: конвертированные материалы из печатного фонда, электронные версии собственных публикаций, «гостевые материалы» (пример совместной работы ГПНТБ России и Университетской и технической библиотеки г. Ганновера, Германия (TIB/UB)). Участие библиотек в наработке электронного ресурса. Собственные вебсайты библиотеки, проблемы поддержания вебсайта, краткое объяснение понятия «аутсорсинга». Примеры реализации технологии «аутсорсинга» в российских библиотеках.
Конверсия печатного материала в цифровой формат (оцифровывание, оцифровка). Сканеры, цифровые фотоаппараты, цифровые видеокамеры. Сканирование. Планшетные, барабанные, планетарные сканеры, их предназначение и особенности. Автоподача и технология обработки в промышленных масштабах. Параметры известных моделей планетарных сканеров. Меры по обеспечению сохранности печатного материала при сканировании, компенсация искажений и случайных загрязнений.
Суть процесса сканирования. Формат записи сканированного материала. Универсальный по отношению к аппаратной платформе (к типу компьютера) формат TIFF. Пространственное разрешение сканера. Количество точек на дюйм (dpi). Объем памяти для записи отсканированного материала. Различия в используемых настройках для конверсии разных видов ресурсов (печатного текста, чертежей, графиков, рукописей, фотографий, изображений). Требования к компьютеру и программному обеспечению. Системы компрессии цифрового массива, краткие сведения о формате JPEG. Оптическое распознавание букв (символов), преимущества и недостатки.
Цифровая съемка и другие средства создания электронных ресурсов. Возможность использования электронных массивов, создаваемых в ходе подготовки печатной публикации.
Сравнение стойкости, долговечности таких видов информационных ресурсов, как печатные, электронные, устные; потребность в стандартизации.
Перечень и характеристика возможных причин потерь информации. Принципы организации службы и технологии хранения документов и данных в ЭБ, а также доступа к архивам. Программные средства и программно-технические комплексы (в том числе технологии семейства RAID, программы-архиваторы, форматы сжатия и их характеристики). Проблемы обеспечения безопасности хранения, передачи, получения и обработки информации. Технологическое обеспечение надежности хранения информации; скорость доступа и темп передачи данных из архивов; долговечность хранения и устойчивость к миграции программных и аппаратных средств.
Проблема обеспечения бесперебойного питания и «горячего резервирования» содержания библиотечных серверов; создание технологических и страховых резервных копий; связь данных технических проблем с режимами работы электронных библиотек и обслуживания пользователей. Особая значимость круглосуточной работы для электронных библиотек.
Виртуальные хранилища как новый вид платных информационных услуг, появившихся в Интернете (физически хранение информации другого владельца на сетевом сервере данной организации).
Практическое занятие5 по теме лекции посвящено работе с Интернет-ресурсами по образованию, в частности с вебсайтами www.informica.ru (Министерство образования и науки Российской Федерации), www.actr.org (Американские советы по международному образованию), с вебсайтами известных российских и зарубежных университетов и ряду других предлагаемых преподавателем.
Контрольные вопросы к Разделу 2
Определение электронных ресурсов.
Определение электронного документа.
Определения электронной публикации и электронных ресурсов.
Свойства электронных ресурсов, отличающие их от печатных материалов.
Виды электронных ресурсов по общественному назначению.
Типы электронных документов.
Что такое мультимедийные ресурсы?
Основные форматы записи текстовых документов и изображений.
Способы визуализации электронных ресурсов.
Технические средства носители электронной информации.
Преимущества жесткого диска по сравнению с магнитными лентами, проявляющиеся при обработке информации.
Основные параметры оптического компакт диска.
Хранилища электронных ресурсов.
Электронные каталоги и базы данных.
Электронные книги.
Электронные полнотекстовые журналы.
Основные способы создания электронных документов.
Меры по обеспечению сохранности электронных ресурсов.