Как следует из документа, ГИС НЭБ представляет собой совокупность документов и сведений в электронной форме, предоставляемых пользователям в том числе с использованием интернета. Целью создания НЭБ определено сохранение исторического, научного и культурного достояния народов РФ, а также формирование основы для создания единого российского электронного пространства знаний.
Объектами хранения НЭБ будут цифровые копий как печатных, так и электронных изданий и документов, сведения о которых станут содержаться в общем каталоге. Функции оператора НЭБ возлагаются законом на Российскую государственную библиотеку (РГБ, бывшая «Ленинка»), которая должна будет осуществлять обслуживание оборудования, программ для ЭВМ и баз данных системы.
Участниками НЭБ должны стать государственные и муниципальные библиотеки, библиотеки образовательных, научных и прочих бюджетных образований, а также организации, обеспечивающие хранение обязательного федерального экземпляра документов в электронной форме и (или) книжных памятников. Все они бесплатно должны предоставить доступ оператора НЭБ к своим фондам.
История проекта: библиотека давно работает
Как пояснял CNews в сентябре 2015 г. директор Российской государственной библиотеки Александр Вислый, проект электронной библиотеки уже некоторое время существует в формате интернет-ресурса нэб.рф. Более того, до принятия закона «Ленинка» как подведомственная Минкультуры организация и так выполняла функции оператора НЭБ в соответствии с письмом-поручением министерства от ноября 2014 г.
Работоспособность ресурса обеспечивается набором программ, установленных на серверах РГБ в рамках исполнения контракта, заключенного Минкультуры в середине 2014 г. с компанией «Электронный архив» («Элар»). РГБ также принимала участие в этом тендере (наряду с компанией «Сканикс»), но уступила победителю, взявшемуся при начальной цене контракта в p133,365 млн осуществить работы за p129 млн.
Тендер на развитие НЭБ в 2015 г. был отыгран только в сентябре прошлого года. Контракт на сумму p73 млн снова достался «Элару». Конкуренцию ему пытался составить «Редсис» с менее затратным предложение в p64,9 млн. «Ленинка» в конкурсе не участвовала.
ПО для библиотеки
Отметим, что в июле 2014 г. Администрация Президента РФ рекомендовала строить НЭБ на отечественном ПО.
Как рассказали CNews в «Элар» в сентябре 2015 г., по факту для создания НЭБ были задействованы программные продукты Exalead , CMS Битрикс, mySQL, Linux CentOS, apache, tomcat, nginx, php, java, C++ Однако в компании настаиваюли на том, что список не дает полного представления о решениях, которые были разработаны и применены «Элар». Речь идет, например, об использованных решениях в части функционала созданных личных кабинетов — для читателей, библиотек и правообладателей, поиску, дедупликации, просмотру и чтению изданий, хранению и сервисам выдачи и др.
В «Элар» поясняли, что пользователям предоставляется свободный доступ к фондам НЭБ, неохраняемым авторскими правами, независимо от физического расположения фонда, через стандартные возможности современных браузеров. Доступ же к электронным документам, охраняемым авторскими правами, осуществляется через программу виртуального читального зала, доступную на безвозмездной основе.
Пользователь устанавливает на своем стационарном компьютере ПО, обеспечивающее защиту документа от скачивания и возможности сделать снимок экрана с открытым документом. В «Элар» был разработан «просмотровщик», в котором по уверению представителей компании, были учтены требования как к защищенности контента, так и к скорости загрузки.
«Просмотровщик независимо от формата выдает только одну страницу издания на монитор, — сообщали в “Элар” — При обращении пользователя к тому или иному изданию через портал НЭБ, ресурс выдается постранично, конвертируя страницу в JPG. Если издание принадлежит к открытому типу, пользователь может сохранить книгу (скачать) в PDF-формате».
«Элар» была разработана подсистема единого электронного читательского билета (ЕЭЧБ), который предназначен для аутентификации, идентификации и авторизации пользователя. Что касается незарегистрированных пользователей, то им доступен в полном объеме весь ресурс изданий, имеющих статус так называемого общественного достояния.
Личные кабинеты в НЭБ создавались таким образом, чтобы связать пользовательский функционал библиотеки, читателя и автора. Читатель в личном кабинете может сохранять электронные документы, делать пометки, закладки, выделять цитаты, видеть историю своих запросов, получать информацию о том, в какой библиотеке на хранении находится то или иное издание, получать от библиотекарей консультации online, отправлять заявку на оцифровку издания и т. д.
Одной из самых важных особенностей личных кабинетов в «Элар» называли автоматизацию составления плана оцифровки изданий, позволяющее избежать дублирование процессов. В рамках проекта для правообладателей была разработана собственная подсистема личных кабинетов, позволяющая авторам или правообладателям подписать договор с оператором НЭБ о согласии на доступ к размещенным в библиотеке изданиям.
Электронный ресурс НЭБ хранится в формате PDF с распознанными подложками, что позволяет использовать поиск по полным текстам изданий.
Библиотечный поисковик
Объясняя работу библиотечной поисковой системы, в «Элар» сообщали, что в НЭБ издание индексируется вместе с библиотечной карточкой «Типично для большинства поисковых систем индексировать данные отдельно, а ресурс отдельно, — говорили в компании — Но индекс должен содержать всю информацию, воспринимать ее как единую сущность Если поисковик находит любую страницу из книжки, он “знает”, какая карточка к ней относится».
Индекс поисковой системы НЭБ содержит полные тексты, поэтому индекс не может храниться в стороннем ЦОДе, утверждали в «Элар». Это было бы равнозначно хранению книг в сторонних ЦОДах и означало бы нарушение статьи 4 Гражданского кодекса РФ «Так как книги, защищенные законодательством об авторском праве, хранятся в библиотеках, то и поисковый индекс у системы распределенный», поясняли в «Элар».
Компанией также была разработана технология дедупликации, которая реализуется вместе с индексированием, и позволяет исключить в поисковой выдаче одинаковые книги. Поисковая система по запросу пользователя предлагает последнее добавленное в НЭБ издание. Остальные книги «схлопываются» списком в карточку просматриваемых изданий в качестве дубликатов.