Службы-генераторы баз данных.
Базы данных и их классификация.
Онлайновые библиотечные каталоги.
Информационные ресурсы с онлайновым доступом.
Службы-генераторы баз данных.
Базы данных и их классификация.
ТЕМА 4 Базы данных как мировой информационный ресурс (4 ч.)
Наиболее многочисленным и важным классом информационных ресурсов в составе информационных технологий являются базы данных (БД). В современном мире практически ни одна автоматизированная система управления не обходится без БД. Базы данных являются основой большинства современных справочных систем, систем автоматизированного ведения бухгалтерского учета, экспертных систем и многих других. Это обусловлено прежде всего простотой и удобством этого типа хранения и извлечения данных.
База данных — упорядоченная организованная совокупность взаимосвязанных данных, предназначенных для хранения, накопления и обработки с помощью ЭВМ. Иначе говоря, это набор данных, который достаточен для достижения установленной цели и представлен на машиночитаемых носителях (магнитная лента, запоминающее устройство, дискета, компакт-диск и т.п.) в виде, позволяющем осуществлять автоматизированную переработку содержащейся в нем информации.
Создание и эксплуатация БД во многом определяют эффективность различных сфер деятельности, начиная от разработки и реализации важнейших решений развития отрасли и целом и кончая удовлетворением индивидуальных запросом руководителей, ученых и специалистов.
Для создания и ведения базы данных (обновления, обеспечения доступа к ним по запросам и выдачи их пользователю) используется набор языковых и программных средств, называемых системой управления базы данных (СУБД).
В зависимости от функционального назначения БД подразделяются на следующие классы:
- научно-технической информации;
- исследовательские;
- учетно-статистические;
- справочные;
- управленческие;
- учебные;
- архивные;
- др.
В России в настоящее время БД распределены следующим образом: наибольшую долю занимают справочные БД — примерно 51%, БД по научно-технической информации —19%, учебные БД — 15% и исследовательские БД — 15%.
По форме представления информации рассматриваются текстовые, числовые, изобразительные, а также звуковые (аудио) БД. В общем числе БД, представленных на мировом рынке, 70% являются текстовыми. Однако рост числа таких БД и их доля в последние годы снижаются.
По характеру записи текста БД подразделяются на текстовые и гипертекстовые.
По содержанию БД разделены на следующие типы:
- документальные (библиографические, реферативные, текстовые, документально-фактографические);
- фактографические;
- лексикографические;
- гипертекстовые.
Документальная БД содержит записи, которые отражают документы и содержат их библиографические описания и, возможную информацию о них. Причем библиографическая БД содержит только библиографическое описание, реферативная БД( библиографические данные и реферат, полнотекстовая НД полный текст документа или его наиболее информативные части, а документально-фактографическая БД — формальное представление содержания документа.
Фактографическая[2] БД — база данных, записи в которой содержат данные о состоянии внешнего мира с учетом ссылок отражающие их документы. Ее разновидности: объектографичесская БД (содержит1 данные об отдельном объекте), база показателей (содержит данные о той или иной характеристике объекта).
Лексикографическая[3] БД объединяет записи, каждая из которых содержит данные об одной лексической единице и соответствует статье словаря.
Гипертекстовая БД включает записи, которые содержат информацию в виде текста на естественном языке и указание на связи их с другими записями, позволяющими компоновать логически связанные фрагменты БД.
Среди упомянутых типов БД в зарубежных информационных системах особенно четко прослеживается тенденция увеличения удельного веса фактографических баз данных, где они составляют около одной трети, а в наиболее крупных информационных фирмах — до 60-70% от общего объема баз данных. В документальных БД все большую долю занимают полнотекстовые базы данных — электронные версии различных изданий. За последние десятилетия они развиваются очень быстрыми темпами и стали важнейшим источником информации во всех областях науки и техники.
По способу доступа БД классифицируют следующим образом:
- БД, размещенные в центрах компьютерных сетей (хостах), их еще называют диалоговые, или интерактивные (доступные через компьютерные сети);
- БД, тиражируемые в коммуникативных форматах;
- БД, тиражируемые с программными средствами (включая CD-ROM);
- локальные БД.
Широкое распространение получили БД на CD-ROM (оптических дисках). Объяснение этому — множество достоинств, среди которых: компактность, большой объем памяти для хранения информации, возможность ведения многоаспектного поиска, независимость от внешних факторов (например, сбоев в системе связи), возможность формировать свой фонд машиночитаемых носителей, возможность быстрого поиска необходимого материала по многим признакам. Причем результаты поиска могут быть выведены на печать, скопированы на дискету или жесткий диск.
С технической стороны использование CD-ROM благодаря удобному интерфейсу и отсутствию необходимости подключения к внешним сетям передачи данных представляется более простым делом, чем с удаленными БД.
Несмотря на известные достоинства компакт-дисков, сейчас наблюдается постепенный переход от CD-ROM к онлайновомому способу предоставления информации.
Появление и быстрое развитие интерактивных информационных систем (ИИС), которые предоставляют пользователям зависимо от их географического положения удаленный доступ к большому числу ИР через терминалы, обусловили появление и значительный рост БД. Использование ИИС в диалоговом режиме обеспечивает следующие возможности:
- последовательное уточнение информационного запроса с целью приведения его в соответствие с информационной потребностью;
- распознавание и выделение разных типов документов;
- просеивание и оценку выдачи документов в процессе поиска и др.
Диалоговый доступ к БД в мире в настоящее время является доминирующим. Услуги диалогового доступа к базам данных представляют собой основной, наиболее динамичный и ведущий МИД современных информационных услуг.
В качестве примера ниже приведены некоторые базы данных общего использования.
Библиографическая БД "Российский сводный каталог по научно-технической литературе". Генератор — Государственная публичная научно-техническая библиотека (ГПНТБ). Эта база данных содержит сведения о зарубежных и российсских книгах, а также о зарубежных периодических изданиях, поступивших в организации — участницы Автоматизированной системы Российского сводного каталога (АС РСвК).
Объем БД составляет более 530 тыс. записей. Ежегодное пополнение — около 30 тыс. записей по всем видам изданий, Каждая запись в БД содержит кроме библиографического описания на языке оригинала индексы Государственного рубрикатора научно-технической информации (ГРНТИ), коды организаций-фондодержателей. Кроме того, часть записей БД содержит: по зарубежным книгам — перевод заглавий на русском языке, а также предметные рубрики и ключевые слова, по зарубежным периодическим изданиям — аннотацию на русском языке, по российским книгам — аннотацию на русском и (или) : английском языках и предметные рубрики.
БД "Продукция предприятий оборонного комплекса". Генератор — Всероссийский научно-исследовательский институт межотраслевой информации (ВИМИ). Содержит сведения о 30 тыс. наименований продукции народнохозяйственного назначения, включая оборудование для переработки сельскохозяйственной продукции, производимой предприятиями оборонной промышленности.
БД "Научно-технические разработки и производственный опыт". Генератор — Российское энергеническое агенство Минэнерго России ("Росинформресурс").
Как показывает анализ мирового опыта, БД являются наиболее перспективной и технологически обеспеченной частью ИР, которые аккумулируют самые различные знания. Они становятся измерителями информационного потенциала страны, а возможность свободного и оперативного доступа к ним — мерой информационности общества.
Первоначально переход на электронную форму издания БД был совершен службами, выпускавшими реферативные журналы, экспресс-информацию, обзоры и прочие виды вторичных документов, поэтому ранее всего появились библиографические (реферативные, справочные) БД. По мере накопления опыта и появления потребностей в электронных изданиях стали выходить полнотекстовые БД, а также статистические сборники, указатели, словари, справочники и прочие виды информации, образующие сегодняшний рынок разнообразных информационных ресурсов.