СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ

Да-да, еще в начате книги заводили плач Ярославны на тему давно ожидаемого, но не состоявшегося пришествия бумажного офиса: несмотря на все новые веяния старые добрые бумажки никуда не денутся еще, как минимум, лет десять. А значит, хоть изредка, а будет у нас возникать нужда в сканировании документов, будь то текст договора или крайне необходимая глава из бумажной книжке, которой, как на грех, не оказатось ни в одной из многочисленных электронных библиотек.

Ввести со сканера текст в компьютер — задача не слишком трудная. Однако работать с таким текстом невозможно: как и любое сканированное изображение, страница с текстом представляет собой графический файл — обычную картинку. А вот перевести его в доступный для редактирования формат может только программа- распознавалка.

FineReader

Сайт:                              http://www.abbyy.com

Цена:                             $160 (Profeccsional), $326 (Corporate)

Именно эту программу чаще всего поминают, когда речь заходит о системах распознавания. И вполне заслуженно – компания ABBYY (http://www.abbyy.com) смогла не просто создать удобный для пользователя и качественный продукт, но и, самое главное, удачно «раскрутить» его, обеспечив «Файнридеру» пламенную любовь всей компьютерной прессы. Одно это, согласитесь, многого стоит…

Другим удачным ходом разработчиков FineReader стало внедрение в продукт массы дополнительных функций, которые простому пользователю, возможно, и без надобности, но зато производят впечатление на определенные группы покупателей. Так, одним из козырей FineReader является поддержка неимоверного количества языков распознавания – почти 200, в числе которых вы найдете экзотические и древние языки, и даже популярные языки программирования (Basic, C/C++, COBOL, Fortran, Java, Pascal)! Так что FineReader сможет без запинки справиться с древнегреческим свитком или с бледными распечатками исходных текстов программ, сделанных вашими предками лет 30 назад.

Как ни странно, большинство пользователей на деле интересуются совсем другим. Офисных работников интересует распознавание типовых форм документов, студентов – возможность быстро «передрать» для реферата многостраничный текст из учебника, сканируя и распознавая книжный разворот целиком, бухгалтеров – возможность автоматического распознавания таблиц и документов на бланках… Все это и многое другое FineReader умеет… или не все, а только частично, в зависимости от модификации продукта.

Скорее всего, возможностей «домашней» версии вам хватит с головой: она отлично уживается со программами Microsoft Office и позволяет распознавать документы на 179 языках (в том числе – 36 с автоматической проверкой орфографии).

Профессиональная версия поддерживает уже почти 200 языков (включая китайский, японский, корейский, тайский, иврит) и позволяет распознавать текст не только с отсканированных документов, но и из файлов в формате PDF.

Все версии FineReader, от самой простой до самой мощной, объединяет, на мой взгляд, главное достоинство программы — интерфейс. Для запуска процесса распознавания вам достаточно просто положить документ в сканер и нажать единственную кнопку. Все дальнейшие операции — сканирование, разбивку изображения на «блоки» и наконец собственно распознавание программа выполнит автоматически. Пользователю останется только установить нужные параметры сканирования — рекомендуется разрешение в 300 dpi и режим черно-белого изображения или LineArt. Впрочем, текст можно отсканировать и в цветном режиме: в этом случае FineReader сможет грамотно распознать цветовое выделение шрифтов и сохранить его в готовом документе.

После завершения распознавания страницы FineReader предложит пользователю выбор: сканировать и распознавать дальше (для многостраничного документа) или сохранить полученный текст в одном из множества популярных форматов — от документов Microsoft Office до HTML или PDF. Можно, впрочем, сразу же перебросить документ в Word или Excel и уже там исправить все огрехи распознавания (без них обойтись просто невозможно). При этом FineReader полностью сохраняет все особенности форматирования документов и графическое оформление.

Источник: Леонтьев В. П. Новейшая энциклопедия компьютера 2011. — М.: OЛMA Медиа Групп, 2010. — 960 е.: ил. — (Новейшая энциклопедия.)

Похожие посты:

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий