Наукові конференції України, Друкарство молоде-2020

Розмір шрифту: 
Алгоритм оцифровування бібліотечних фондів для комп’ютеризованої інформаційної бібліотечної системи
Роман Романович Іваськів

Остання редакція: 2020-04-17

Тези доповіді


При створенні електронних фондів комп’ютеризованої бібліотечної інформаційної системи постає потреба у розробці алгоритму дій для ефективного та якісного оцифровування бібліотечних фондів. На першому етапі потрібно здійснити пакетне сканування фізичного носія інформації (див рис.). Для цього використовується програмне забезпечення встановлене на терміналі користувача. Залежно від встановленого інтервалу часу програмний засіб здійснює запит до пристрою зчитування графічної інформації.
Опісля отримані зображення надсилаються на сервер, з використанням хмарних засобів опрацювання зображень, користувачу пропонуються здійснити пакетні геометричні редагування зображення, а саме виправлення орієнтації зображення та трапецієподібності зображення. Або ж підтвердити правильність автоматичного виправлення.Оскільки при скануванні можливі три ситуації компонування сканованої сторінки: одна сторінка; одна сторінка та елемент іншої сторінки; дві сторінки на сканованому зображенні. Тому є потреба в етапі, на якому здійснюється поділ зображення на сторінки.Оброблене на попередньому етапі зображення, виправлення нахилу тексту та вибору значущого вмісту, а також виставлення значень полів — ця операція здійснюється для покращення читабельності тексту. Далі здійснюється пакетне коригування різкості, контрасту та балансу білого.На останньому етапі здійснюється розпізнавання зображень та формування текстових масивів з прив’язкою до зображень. Завдяки цьому стає можливою реалізація пошуку по тексту, генерування покажчиків та змісту для електронного видання.Всі описані операції з обробки зображень здійснюються засобами віддаленого сервера, що забезпечує можливості командної роботи та завдяки командному контролю зменшує відсоток браку й помилок.


Ключові слова


комп'ютеризована інформаційна бібліотечна система; оцифрування книг; розпізнавання тексту

Full Text: PDF