Еженедельник
Объединенного института ядерных исследований

(Электронная версия с 1997 года)
Архив Содержание номера О газете На главную Фотогалерея KOI8

№ 42(3931) от 31 октября 2008:

Версия № 42 в формате pdf (~3.4 Mb)

Следующий номер газеты выйдет 14 ноября

RCDL-2008

Почти все об электронных библиотеках

С 7 по 11 октября в ЛИТ ОИЯИ проходила десятая Всероссийская конференция "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - RCDL-2008. Конференция собрала участников из России, Австрии, Греции, Италии, Швейцарии, Украины.

Диапазон направлений и география российских участников были очень широки: от столичных НИВЦ МГУ, ВЦ РАН, Института проблем информатики, Института систем информатики, Института программных систем, Института проблем управления, МИФИ, МФТИ, МЭИ, МГТУ, - до столичных же Института космических исследований, Института геохимии и аналитической химии, НИИЯФ МГУ, ИЗМИРАН, Российской государственной библиотеки. Также были представлены Карельский научный центр РАН, Институт экологии растений и животных Уральского отделения РАН, Институт вычислительных технологий Сибирского отделения РАН, государственные университеты Санкт-Петербурга, Ярославля, Петрозаводска, Воронежа, Перми, Тулы, Казани, Новосибирска и другие университеты, исследовательские центры, коммерческие фирмы.

О целях конференции, обсуждаемых на ней проблемах мы попросили рассказать сопредседателя оргкомитета конференции Л.А.Калиниченко (Институт проблем информатики РАН, Москва), одновременно являющегося и председателем постоянно действующего Руководящего комитета по тематике RCDL:

Эта конференция уже десятая, а как и когда возникла идея их проведения?

С 1993 года в России проводились международные конференции по базам данных ADBIS, но обстоятельства сложились так, что с 1997 года они проходят за пределами России, в государствах Восточной Европы. А у нас образовалась пустота, которую очень скоро заполнило вновь образовавшееся направление, очень близкое базам данных, - цифровые библиотеки, чаще называемые электронными. Это направление занимается представлением информационных систем, баз знаний, - то есть занимает более широкую нишу, чем просто представление библиотек в электронном виде.

Кого собирают ваши совещания, ведь круг их участников так широк?

Да, за десять лет и состав участников сильно изменился. Хотя и в этом году мы получили финансовую поддержку от РФФИ и РАН, но поначалу РФФИ более основательно поддерживал наши конференции, и многие специалисты, занимающиеся информационными технологиями, получали индивидуальный грант для участия в них. И, хотя проводили мы их в Санкт-Петербурге, Ярославле, Переславле-Залесском, Суздале, Петрозаводске, Протвино, Дубне, но кроме Москвы и Питера постоянно участвуют специалисты из Новосибирска, Омска, российской "провинции", да и Киевский институт программных систем бывает представлен каждый раз.

У нас с самого начала этих конференций существует традиция довольно жесткого отбора докладов: присланные аннотации рецензируются хорошими специалистами, но отбор происходит на заседании программного комитета, где смотрят не только на рецензию, но и обсуждают саму статью. Но, к сожалению, последние годы этот достаточно жесткий отбор не подкрепляется качеством докладов, наблюдается некоторая деградация. В наших конференциях поначалу участвовало очень много иностранцев, и на первой дубненской в 2002 году их было достаточно много, - сейчас гораздо меньше, правда, труды конференции печатаются на русском языке, а иностранцы, как правило, по-русски не читают.

Аналогичные конференции проводятся в Европе, США?

Есть европейская конференция по электронным библиотекам, в США сначала было даже две, потом они объединились, в Юго-Восточной Азии что-то проводится. Как-то раз в Индии провели, наверное, самую большую конференцию по этому направлению - собрали около 700 человек, а на европейских обычно бывает до 250 участников. Но в Европе - и в Западной и в Восточной - эти исследования сейчас переживают не лучшие времена, и в ADBIS тоже дела идут не очень хорошо. Они в рамках своей конференции попытались собрать вместе аспирантов, - оказалось, что их не очень-то и много. И у нас молодежь трудно в науку привлечь.

Параллельно с нашей конференцией проходят заседания РОМИП - это объединение специалистов, разрабатывающих поисковые системы. Эти системы они объективно, по специальным тестам, сравнивают друг с другом, ранжируют - это полезная работа. Их поддерживают коммерческие компании, вроде Yandex, вот там собираются молодые ребята, но их организует инициативная группа отдельно от нашей конференции. При этом их заседания обычно проводятся перед началом нашей конференции или сразу после нее, и тогда они часть наших выступлений слушают, а мы - часть их, так что какой-то обмен информацией происходит.

Объясните, пожалуйста, для неспециалистов, что же все-таки понимать под электронными библиотеками?

Электронные библиотеки - это не только автоматизация традиционных библиотек, это своя особая область, особый продукт. Их основная цель - собирать большие коллекции чего угодно, хоть научных публикаций, хоть музыки. Так они и развивались последние десять лет, по крайней мере, на Западе. У нас это как-то менее выражено из-за более тесной связи с наукой. На Западе они развиваются на базе университетов. И если там имеются десятки открытых платформ для поддержки электронных библиотек, то у нас, практически, ничего не сделано, разве что только в социологии. Это тоже одна из причин, почему у нас сегодня нет прогресса в работах, пропадает интерес, ну а с деньгами как было плохо, так и осталось.

Ведутся исследования в области текстового поиска информации - это прикладная лингвистика, онтология. Онтология, занимающаяся задачами описания реального мира, его концептуализацией, в последнее время развивается очень бурно. Она имеет отношение к электронным библиотекам, так как там создаются словари, но более продвинутые, чем библиотечные тезаурусы. Вот и накануне нашей конференции прошло специальное совещание по онтологии, на котором были представлены обзорные доклады, представляющие всю картину состояния дел. Я участвовал в нем, но, по-моему, там возникла некоторая пестрота и путаница.

На нынешней конференции тоже делались доклады по онтологии?

И не только, но и по информационному текстовому поиску, рассматривались вопросы семантики, представлялись конкретные системы - некоторые коллекции информации, ориентированные на поддержку каких-то пользователей или решение задач. Очень развиваемое сегодня направление - автоматическое реферирование и обработка резюме. Бывает, нам представляют и чисто научные доклады, имеющие косвенное отношение к библиотекам, мы их тоже принимаем. Например, А.Е.Авраменко из Пущинской радиоастрономической обсерватории каждый год рассказывает нам что-нибудь о пульсарах. Он связывает свои доклады с объектным подходом к построению информационных систем, или с онтологией, или еще с чем-нибудь из этой области. Так что мы за эти годы уже начали немного разбираться в пульсарах.

На этой конференции мы обсуждали распределенные платформы, с разных сторон рассматривали инфраструктуру для электронных библиотек. Такая задача, как многолетнее сохранение информации, - как сохранить ее сейчас, чтобы не потерять через, например, лет 40? Или совершенно новая и достаточно серьезная вещь - планирование сохранения информации. У нас об этом зачастую и не задумываются, особенно сами заказчики, а не создатели каких-то баз данных - "сохраняйте все в pdf-формате!" А в докладе А.Раубера (Австрия) было четко показано, почему долго хранить в формате pdf плохо.

Сейчас происходит некая гибридизация: возможности Грида соединяются со средствами создания электронных библиотек для того, чтобы создать инструменты для научных исследователей. В двойном гибриде проявляется третий - среда для проведения научных исследований, в которой можно информацию хранить, находить, проводить вычисления и тому подобное, - и это именно то, что мы сегодня называем электронными библиотеками. Уже заметно явное движение от простых коллекций до создания таких сред.

И, если подводить итоги конференции...

При всех их недостатках эти конференции очень полезны. Мы сейчас пытались обсуждать, как сделать их более привлекательными. Есть идея - организовать индустриальные секции, на которых делали бы обзорные доклады Google, Oracle и другие коммерческие компании. Там работают наши же люди. А для привлечения молодежи необходимо организовать отдельную аспирантскую секцию. Но для всего этого нужны деньги. Хотя в этом году мы молодых неплохо поддержали: некоторым оплатили и проезд, и проживание в гостинице. Конечно, молодежь надо привлекать. Развалить все легко, скупой платит трижды, а может, еще больше...

Ольга ТАРАНТИНА


Редакция Веб-мастер