Оцифровка документов
Оцифровка документовЗдравствуйте! Слышала, что сейчас многие библиотеки оцифровывают свои архивы. Возникает вопрос: как они это делают? Неужели они просто сканируют и распознают?!!!И это миллионы документов, а некоторые просто так в сканер не засунешь, да и распознавание очень много времени, сил, средств и пр. уходит! Я понимаю, что есть супер сканеры, супер распознаватели и пр., но всё-таки....Тем более нужно же както структурировать, обрабатывать, хранить и пр. В каком это формате хранится, какими средствами....И неужели они просто сканят и сканы хранят?! Они же много весят! Я слышала, что есть специальная программа, а может машина, которая сразу переводит куда нужно и XML в этом както замешан....Но как там всё действует....Полазила по Интернету, говорят только о сканировании....Ну хорошо, сканирование, а после куда, как, в какой формат? Какими средствами обрабатывать, хранить?
И вот вытекающий вопрос: эл. книги, в каком они формате, как они делаются, как с этой информацией работать?!
Заранее спасибо!)))
Уже и не знаю где искать(
И вот вытекающий вопрос: эл. книги, в каком они формате, как они делаются, как с этой информацией работать?!
Заранее спасибо!)))
Уже и не знаю где искать(
Ответ(ы) на вопрос:
сканируют и переводят в формат djvu (дежавю) . Он в несколько раз компактнее pdf Гляньте здесь: http://www.djvu-inf.narod.ru/
Библиотеки, как правило, обращаются в специализированные компании, я это знаю, потому что у меня мама библиотечный работник и они обращались для оцифровки своих архивов в эту компании https://archivexpert.ru/u7b/ocifrovka_dokymentov/ это "Архивный эксперт" у них очень современная техника, позволяющая быстро и качественно перевести все в электронный архив.
книги идут в формате pdf или djvu,иногда в doc
Да блин все дело в автоматизации процесса! Да ничего гениального из Сканирования и распознования не придумано! НО! есть сканеры которые могут сканировать в автомате хоть 500 листов (стоять постоянно не надо) , и сохранять в удобные форматы (pdf) Есть софт, который умеет бысто и качественно распозновать (finereader) + пару скриптов и ручная проверка На бывшей работе я в день по 2000 листов распозновал без напряга, учитывая что это было не основное направление нашей работы
Не нашли ответ?
Похожие вопросы