podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2

Версия для печати

«Сладкая парочка» FineReader 9.0 + Pentax Optio и встроенные камеры

Новостной повод – начало продаж комплекта, фактическая тема – перспективы превращения цифровой фотографии в текстовый файл. Реальные технические проблемы, консерватизм пользователей или отсутствие информации?

Вместе дешевле

Причем намного дешевле. По крайней мере, в этом нас уверяют маркетологи уважаемой компании ABBYY. Цена комплекта (8999 руб.) заявлена ниже, чем розничная цена фотоаппарата Pentax Optio A30 (9100 руб.). Наверное, в магазинах эту камеру можно найти и купить за такие деньги, хотя price.ru нам дает ценовой диапазон реальных предложений 7700-8600 руб. Но цена пакета все равно выглядит неплохо, даже если ориентироваться на самые выгодные розничные предложения. На этом обсуждение финансового аспекта закончим и перейдем к более интересным темам.

Об истории развития и совершенствования систем распознавания текста можно написать целую книгу, тема чрезвычайно интересная. Продукт ABBYY традиционно хорош, компания по-моему уже лет пятнадцать специализируется на этом направлении. На российском рынке серьезных конкурентов программе FineReader не осталось, хотя когда-то существовала реальная альтернатива в виде программы Cuneiform компании Cognitive Technologies. Если не ошибаюсь, последняя версия Cuneiform вышла в 1999 или 2000 году. В эпоху развития электронного документооборота системам распознавания отведена ключевая роль, без них слишком много бумажных документов оказалось бы навсегда утрачено. До настоящего момента попыток официально «подружить» систему OCR (Optical Character Recognition – оптическое распознавание символов) с цифровой камерой я не припоминаю, программа традиционно работала в связке со сканером.

Впервые возможность работы с цифровым фото была официально анонсирована в FineReader 8.0, программу обучили автоматически исправлять геометрические искажения фотоснимка текста. Примерно год назад ради интереса попробовал, результат не вдохновил. Т.е. в принципе работало, но при наличии сканера особой практической пользы для себя не увидел. Лишняя морока, и слишком много ошибок пришлось бы исправлять вручную, в то время как отсканированные страницы распознаются почти безупречно. Однако времена меняются, и цифровая камера стала массовым продуктом, заставить FineReader прилично работать с цифровыми снимками очень заманчиво, и сразу резко расширяет круг потенциальных потребителей. Удалось ли разработчикам существенно повысить качество распознавания снимков? Было очень интересно сравнить, результаты ниже.

Еще один любопытный аспект – работоспособность системы распознавания в связке с мобильным телефоном. Тоже с год назад попробовал со встроенной камерой 1.3 Mpx и больше на эту тему даже не задумывался, уж слишком удручающим оказался итог эксперимента. Однако с тех пор двухмегапиксельные модули стали стандартом, трех и пяти – уже не редкость. Оптика встроенных камер тоже стала лучше, почему бы не поэкспериментировать с новой версией «распознавалки»?

Объекты, оборудование и порядок тестирования

Строго говоря, речь не идет о полноценном и всеобъемлющем тестировании продукта. Скорее это общий тест на работоспособность программы с разными источниками цифровых снимков, в том числе и с входящей в комплект камерой Pentax Optio A30. Данная модель камеры была выбрана не случайно, помимо маркетинговых, ценовых и т.п. соображений сыграло роль наличие нескольких режимов специально для фотографирования текста. Опции вынесены в отдельное подменю и позволяют парой-тройкой нажатий на джойстик сконфигурировать аппарат для получения оптимального результата.

Телефоны со встроенными камерами были взяты те, что оказались под рукой: пара Самсунгов с модулями 2 Mpx и смартфон SE P1i с камерой 3.2 Mpx. Самсунгами фотографии объектов делались вперемешку, SE P1i снимал со встроенной светодиодной вспышкой и без нее.

В качестве объектов было взято три обычных пресс-релиза, сложный для распознавания слегка помятый кусок газеты с мелким текстом и завалявшаяся в шкафу книжка с печатью средней паршивости на дешевой серой бумаге. Книжка была взята не случайно, в FineReader 9.0 заявлена интеллектуальная коррекция искажений, возникающих при фотосъемке книжного разворота.

Первый этап – достаточно небрежная съемка объектов без особых стараний получить качественное изображение. Но и без стараний что-то специально испортить. По принципу «что вышло – то вышло», скорее всего, именно так будет фотографировать текст человек, впервые столкнувшийся с подобной задачей. Снимки делались цветные и черно-белые, попытка повторялась, когда возникало ощущение неудачного кадра. В памяти смартфона случайно затесался снимок рекламной таблички в метро, заодно и этот кадр попал в тестовую коллекцию. Как впоследствии выяснилось, попал удачно.

Полученные файлы были обработаны в FineReader 8.0 в автоматическом режиме, получившийся документ сохранен в формате pdf. Результат работы Pentax Optio A30 можно посмотреть здесь (360 Кб), телефонов Samsung – здесь (240 Кб) и смартфона SE P1i – здесь (280 Кб). Pentax Optio A30 и FR 8.0 справились с задачей неплохо, съемка в черно-белом варианте оказалась удачнее. Но ошибок распознавания все равно многовато. Двухмегапиксельные модули Samsung выдали предсказуемый результат практической непригодности, хотя один пресс-релиз изумил неожиданно качественным итоговым документом. Видимо, попался какой-то особенно хорошо распознаваемый шрифт. Но рассчитывать на такую удачу явно не приходится. SE P1i расстроил в меру: определенный потенциал просматривается, есть за что побороться. Кстати, однозначное «табу» на использование вспышки: неравномерная засветка и блики катастрофически портят изображение. Обрезанное изображение в документе pdf – итог не совсем корректной работы программы FR 8.0 при вычленении рабочей области документа и сохранении в формат pdf листов альбомной ориентации.

Те же файлы после небольшой предварительной подготовки: вручную обозначены зоны текста и картинок. Pentax Optio, Samsung и SE P1i. Уже заметно лучше, 3.2 Mpx позволяют надеяться на приемлемый результат при съемке в черно-белом режиме без вспышки листов А4 с крупным текстом.

Теперь те же файлы без всякой предварительной подготовки загоним в новую, девятую версию FineReader. Pentax Optio, Samsung и SE P1i. Результат, как говорится, налицо: качество распознавания радикально улучшилось, особенно хорошо это видно на примере с SE P1i. Сохранение в pdf сработало почти идеально без всяких танцев с бубном вокруг настроек, тоже приятно. Проявились и некоторые любопытные особенности работы программы, об этом ниже.

Чего можно реально добиться

Наконец, заключительный этап эксперимента. Обретя некоторый опыт и поняв, как снимать не надо, изготавливаем одинаковый набор тестовых файлов для Pentax Optio, Samsung х820 и SE P1i. На этот раз стараемся сделать удачные снимки, хотя и без чрезмерного фанатизма с подбором освещения, максимально возможного заполнения кадра и т.п. Pentax Optio, Samsung и SE P1i. Вот теперь понятно, на что действительно можно рассчитывать. Pentax Optio отрабатывает неплохо, количество ошибок в пределах допустимого, и получающийся текст пригоден для употребления даже без правки. Встроенная камера 3.2 Mpx однозначно годится для съемки и распознавания офисных документов формата А4, при необходимости можно работать и с не мелким книжным текстом. Что-то более мелкое (газеты, журналы и т.п.) – как повезет. Встроенная камера 2 Mpx без автофокуса позволяет получать стабильно неплохие результаты при съемке офисных документов, это ее разумный предел. Если очень нужно, можно фотографировать и книжные страницы, но рассчитывать на хороший результат опасно.

Многое зависит от качества оптики встроенной камеры и наличия автофокуса, количество мегапикселей – не самое главное. Удачно зашел в гости товарищ со своим SE K750i (камера 2 Mpx с автофокусом), сделали пару снимков со стандартными настройками и при неважном освещении. Результат оказался неожиданно хорошим и при некотором старании наверняка оказался бы лучше, чем удалось добиться от модуля 3.2 Mpx в SE P1i.

Что изменилось в программе FineReader

Теперь о некоторых тонкостях работы с программой. Главная неожиданность – явно лучшее качество распознавания сложных текстовых объектов при съемке в цвете. Особенно заметно на участках текста с цветным фоном. При черно-белой съемке в автоматическом режиме программа частенько вообще игнорирует картинки, приходится обозначать эти блоки вручную. Еще один сюрприз – явно изменившийся алгоритм работы с картинками, программа приобрела дополнительный интеллект. Теперь FineReader не выискивает текстовые фрагменты в иллюстрациях и даже отказывается это делать в принудительном порядке (пример с рекламой в метро).

Заметное повышение качества распознавания достойно всяческих похвал, девятая версия – значительный шаг вперед, а не мелкие улучшения ради сбора денег за очередной апгрейд. Но чем разработчикам не угодил режим сканирования без распознавания – ума не приложу. Избавили тружеников офиса от лишней кнопки на панели инструментов для максимального упрощения процесса? Приятно, что при загрузке пакета графических файлов процесс распознавания всегда запускается автоматически, но порой это приводит к пустой трате времени. Типичный пример – документация с иллюстрациями в виде графиков, схем с пояснениями и т.п. Проще и быстрее сразу вручную несколькими кликами обозначить участки текст/иллюстрации на каждой странице и запустить распознавание. Теперь вместо этого приходится ждать, пока программа мучительно продерется через дебри мелкого шрифта на иллюстрациях, потом удалять автоматически созданные блоки на каждой странице, обозначать блоки вручную и опять запускать процесс распознавания. Так и не нашел в интерфейсе «выключатель» этой лишней (для меня) автоматики.

Судя по всему, максимальное поддерживаемое разрешение сканирования – 600 dpi, это предельная цифра в настройках. И даже с готовыми изображениями в большем разрешении FineReader работать не хочет, просит уменьшить разрешение до 600 dpi. Логичное решение с позиции «как бы чего не вышло», а то ведь неразумный пользователь запустит сканирование целой страницы в режиме 1200 dpi и подвесит компьютер файлом в 450 Мб. А как быть с небольшим участком мелкого, но вполне читабельного текста? Сканировать в графический редактор нужный фрагмент, делать скриншот и его распознавать? Срабатывает, но процесс получается долгий и муторный.

В процессе распознавания программа активно сверяет варианты со встроенными в нее словарями и подставляет подходящие по написанию слова. Если не проверять неуверенно распознанные участки, то получившийся текст может стать источником хорошего настроения: «Потел» вместо «Павел», полученный-домученный, получить-подучить и т.п.

Еще кое-какие «улучшения» и «усовершенствования» интерфейса не понравились при первом поверхностном знакомстве с продуктом, но это вопрос привыкания. Что касается работы программы в традиционном режиме сканирования бумажного оригинала, то здесь придраться трудно, разве что посетовать на резко выросший аппетит к системным ресурсам компьютера. Покопавшись в шкафу, нашел обзор четвертой версии FineReader-а десятилетней давности, ради эксперимента прогнал журнальную статью через FineReader 9.0. Вся процедура заняла минут 15-20, и результат порадовал, желающие вспомнить о «детских болезнях» популярного продукта могут взять текст здесь.

Резюме

Связка FineReader + Pentax Optio оказалась вполне работоспособной, этот блин комом не назовешь. Однако для нас с вами важнее другое: на рынке появился продукт, позволяющий реализовать потенциал встроенных в современные телефоны фотокамер. Причем реализовать на уровне реальной практической пользы, а не в качестве демонстрации возможностей в далеком будущем. Да, такая функциональность нужна далеко не всем, но те, кому она нужна, ее наверняка по достоинству оценят.

Обсуждение на форуме >>>

Сергей Потресов (sergey.potresov@mobile-review.com)
Опубликовано - 04 декабря 2007 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:

27.04.2017 Alibaba запустит в России собственный платежный сервис

27.04.2017 В Госдуму внесен законопроект об усилении контроля за продажей SIM карт

27.04.2017 LG опубликовала финансовые результаты своей деятельной за прошедший первый квартал 2017 года

27.04.2017 Новые учебные программы от Apple стартуют в мае во всём мире в её региональных магазинах Apple Store

27.04.2017 Samsung объявила финансовые результаты за первый квартал 2017 года

26.04.2017 OnePlus 5 появился на рендерах

26.04.2017 iPhone 8 может задержаться с выходом из-за поставщиков комплектующих

26.04.2017 В ближайшие два года Xiaomi выйдет на рынок США

Hit

26.04.2017 Видео на канале: Обзор Alcatel A3 enjoy now

26.04.2017 Lenovo может закрыть свой суббренд ZUK

26.04.2017 Skylink обновляет тарифную линейку

26.04.2017 ARCHOS Drone - первый квадрокоптер Archos доступный в России

26.04.2017 Российские операторы связи начали отказываться от СМС в пакетных тарифах

26.04.2017 ZTE MAX XL – недорогой 6-дюймовый фаблет для североамериканского рынка

26.04.2017 AliExpress вводит для России услугу однодневной доставки товара

26.04.2017 ESET: «всеядный» троян перехватывает пароли от мобильного банка, Facebook и Instagram

25.04.2017 Sega показала пневматическую копию «силового кулака» из Warhammer 40k

25.04.2017 Google Maps переведут все на язык пользователя автоматически

25.04.2017 Навигация от 2ГИС научилась строить пешие маршруты

25.04.2017 Платежные сервисы Samsung Pay и Apple Pay стали доступны держателям карт Visa Сбербанка

Hit

25.04.2017 Видео на канале: Сравнение Samsung Galaxy S8+ и S7 Edge

Hit

25.04.2017 Видео на канале: Сравнение Samsung Galaxy S8+ и LG G6

Hit

25.04.2017 Видео на канале: Обзор Samsung Galaxy S8+

Hit

25.04.2017 Видео на канале: Тест IP68 Samsung Galaxy A7 2017

25.04.2017 Яндекс запустил платформу для совместной работы и общения — «Коннект»

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.