| |
| |  | |  | | | | | Планшетный, планетарный и сканер на основе ЦФК: сравнение и методы сканирования | |
| | Перевод книги и любого другого сшитого документа в электронный вид предполагает решение нескольких задач: непосредственно сканирование, обработка полученных изображений, их последующая компоновка в файл и, в некоторых случаях, оптическое распознавание текста (ОРС). Для сканирования книг используется 3 типа сканеров: планшетный, планетарный и сканер на основе цифровых фотокамер.
Планшетный сканер, наиболее распростра- ненный вариант, представляет собой планшет, внутри которого под прозрачным стеклом расположен сканирующий механизм.
| Планетарный сканер отличается сканирующей головкой, расположенной сверху, на значитель- ном удалении от сканируемого документа. Книга помещается в колыбель, регулируемую под необходимый размер сгиба корешка.
| Сканер на основе ЦФК, как подвид планетарного, оснащен V-образной колыбелью, позволяющей сканировать книги не раскрывая их полностью в режиме бережного сканирования.
|
Ниже представлены сравнительные характеристики трех типов сканеров и поставляемого с ними программного обеспечения на различных этапах создания электронной книги.
I. Получение электронных образов сканируемого документа
| Планшетный сканер | Планетарный сканер | Сканер на основе ЦФК |
Сшитый / расшитый документ | Сканер предназначен для оцифровки расшитых документов; при сканировании нерасшитых документа возникают проблемы с искажением изображений.
| Сканер предназначен для оцифровки как сшитых, так и расшитых изданий.
| Сканер предназначен для оцифровки как сшитых, так и расшитых изданий.
| Возраст издания | Подходит для оцифровки относительно новых изданий, так как ветхие чаще всего не поддаются расшивке в связи с культурной или юридической значимостью. При сильном сгибании корешка книги есть вероятность повредить хрупкое издание.
| Позиционируется производителями как сканер для оцифровки и относительно новых, и ветхих изданий. Однако в последнем случае все же есть вероятность повредить корешок книги, так как издание должно быть развернуто полностью, на 180 градусов. Часть моделей оснащена прижимным стеклом, у остальных контакт между сканируемым изданием и сканирующим элементом отсутствует.
| Подходит для оцифровки как относительно новых, так и ветхих изданий за счет специальной V-образной колыбели, позволяющей не раскрывать книгу полностью (на 90 градусов), что сводит к минимуму вредное воздействие на издание.
| Положение книги во время сканирования | Позиция книги постоянно смещается, что затрудняет последующую обработку с помощью ПО.
| Книга остается в одной и той же позиции.
| Книга остается в одной и той же позиции.
| Скорость сканирова- ния (цветной режим) | 300 стр./час
| 400-700 стр./час
| 500-700 стр./час
| Перелистывание страниц |
Вручную
| Вручную
| Вручную (существуют модели с автоматическим перелистыванием, однако ценные, ветхие книги, составляющие основу библиотечного фонда, не рекомендуется оцифровывать на таком оборудовании во избежание повреждений).
| Формат сканируемого документа | A4
| A2-A4
| A2-A4
| Разрешение получаемых изображений | 2400 и выше (оптическое)
| 400-600 dpi (среднее разрешение полученных изображений – 400 dpi. В большинстве планетарных сканеров (кроме Zeutschel и CMA) увеличение разрешения достигается интерполяцией программным способом, что приводит к сильной потере качества).
| 130-470 dpi (оптическое)
| Освещение сканируемого предмета | Частичное; освещение не достигает затемненной области у корешков книги, поэтому качество изображения оставляет желать лучшего.
| Полное
| Полное
| Эксплуатация | Небольшой по размеру (подходит для дома или офиса), очень прост в эксплуатации, запускается нажатием одной кнопки. Не модернизируется.
| Занимает много рабочего пространства, оснащен педалью для управления. Не модернизируется.
| Занимает много рабочего пространства, однако практически не подвержен поломкам, поскольку является сканирующей платформой. Модернизируется за счет замены фотокамер на более профессиональные варианты. Запускается нажатием одной кнопки.
| Цена | От 1500 руб. | От 600 000 руб. | От 395 300 руб. |
II. Обработка полученных изображений
У всех сканеров, участвующих в сравнении, есть общий минус — изображения, полученные от любого из них, требуют корректировку в соответствии с оригиналом, приведение к одному и тому же виду, устранение искажений, выравнивание с помощью ПО (обычно прилагается к сканеру), что и представляет собой второй этап создания электронной книги. Чаще всего данные операции выполняются в пакетном режиме — параметры обработки выставляются для первой страницы, а затем применяются ко всем остальным.
Основные проблемы, возникающие при сканировании книг:

| Планшетный сканер
- Освещение сканера не достигает затемненной области у корешка книги, даже если используется редуцирующая линза большой резкости; информация, попавшая в данную область, не восстанавливается с помощью ПО.
- Необходимо, чтобы сканируемое издание оставалось в одном и том же положении, иначе оператору придется заниматься обрезкой страниц вручную, поскольку настройки пакетного режима не подойдут ко всем страницам; распознавание текста в дальнейшем будет производиться с потерей качества.
Решение:
- Тщательно следить за тем, чтобы сканируемое издание находилось параллельно границам сканера. - Использовать ПО для устранения искажений
| 
| Планетарный сканер
Основной проблемой считается большое количество искажений. Их количество минимизируется, но не устраняется полностью, за счет прижимного стекла, используемого в некоторых моделях планетарных сканеров.
Решение:
Использовать ПО для устранения искажений. Неудобство заключается в очень низкой скорости обработки изображений, за счет чего значительно снижается общая скорость сканирования книг этим типом сканеров.
| 
| Книжный сканер на основе цифровых фотоаппаратов
Эффект «Margin crawl», обусловленный толщиной бумаги издания, заставляет изображения по мере сканирования немного продвигаться по горизонтали.
Решение:
При пост-обработке изображений менять настройки кадрирования каждые 100-200 страниц.
|
III. Оптическое распознавание символов, компоновка файла электронной книги с возможностью редактирования и полнотекстового поиска
Ниже приведена таблица сравнения точности распознавания символов изображений наивысшего качества от книжного, планшетного и планетарного сканеров; для проверки использовался Abbyy Finereader V.8 Professional Edition.
Количество | Планшетный сканер | Планетарный сканер | Сканер с V-образной колыбелью | Сомнительные символы | 217
| 186
| 8
| Всего символов | 2267
| 2214
| 2355
| Точность | 90,42%
| 91,59%
| 99,66%
|
Каждое из сравниваемых устройств имеет свои достоинства и недостатки; выбор оптимального решения зависит от возможности расшивки документа, его состояния (относительно новое или ветхое издание), требований к получаемому файлу электронной книги и многих других условий.
Скачать текст в PDF >>>
| |
| |  | |  | | |