podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2

«Сладкая парочка» FineReader 9.0 + Pentax Optio и встроенные камеры

Новостной повод – начало продаж комплекта, фактическая тема – перспективы превращения цифровой фотографии в текстовый файл. Реальные технические проблемы, консерватизм пользователей или отсутствие информации?

Вместе дешевле

Причем намного дешевле. По крайней мере, в этом нас уверяют маркетологи уважаемой компании ABBYY. Цена комплекта (8999 руб.) заявлена ниже, чем розничная цена фотоаппарата Pentax Optio A30 (9100 руб.). Наверное, в магазинах эту камеру можно найти и купить за такие деньги, хотя price.ru нам дает ценовой диапазон реальных предложений 7700-8600 руб. Но цена пакета все равно выглядит неплохо, даже если ориентироваться на самые выгодные розничные предложения. На этом обсуждение финансового аспекта закончим и перейдем к более интересным темам.

Об истории развития и совершенствования систем распознавания текста можно написать целую книгу, тема чрезвычайно интересная. Продукт ABBYY традиционно хорош, компания по-моему уже лет пятнадцать специализируется на этом направлении. На российском рынке серьезных конкурентов программе FineReader не осталось, хотя когда-то существовала реальная альтернатива в виде программы Cuneiform компании Cognitive Technologies. Если не ошибаюсь, последняя версия Cuneiform вышла в 1999 или 2000 году. В эпоху развития электронного документооборота системам распознавания отведена ключевая роль, без них слишком много бумажных документов оказалось бы навсегда утрачено. До настоящего момента попыток официально «подружить» систему OCR (Optical Character Recognition – оптическое распознавание символов) с цифровой камерой я не припоминаю, программа традиционно работала в связке со сканером.

Впервые возможность работы с цифровым фото была официально анонсирована в FineReader 8.0, программу обучили автоматически исправлять геометрические искажения фотоснимка текста. Примерно год назад ради интереса попробовал, результат не вдохновил. Т.е. в принципе работало, но при наличии сканера особой практической пользы для себя не увидел. Лишняя морока, и слишком много ошибок пришлось бы исправлять вручную, в то время как отсканированные страницы распознаются почти безупречно. Однако времена меняются, и цифровая камера стала массовым продуктом, заставить FineReader прилично работать с цифровыми снимками очень заманчиво, и сразу резко расширяет круг потенциальных потребителей. Удалось ли разработчикам существенно повысить качество распознавания снимков? Было очень интересно сравнить, результаты ниже.

Еще один любопытный аспект – работоспособность системы распознавания в связке с мобильным телефоном. Тоже с год назад попробовал со встроенной камерой 1.3 Mpx и больше на эту тему даже не задумывался, уж слишком удручающим оказался итог эксперимента. Однако с тех пор двухмегапиксельные модули стали стандартом, трех и пяти – уже не редкость. Оптика встроенных камер тоже стала лучше, почему бы не поэкспериментировать с новой версией «распознавалки»?

Объекты, оборудование и порядок тестирования

Строго говоря, речь не идет о полноценном и всеобъемлющем тестировании продукта. Скорее это общий тест на работоспособность программы с разными источниками цифровых снимков, в том числе и с входящей в комплект камерой Pentax Optio A30. Данная модель камеры была выбрана не случайно, помимо маркетинговых, ценовых и т.п. соображений сыграло роль наличие нескольких режимов специально для фотографирования текста. Опции вынесены в отдельное подменю и позволяют парой-тройкой нажатий на джойстик сконфигурировать аппарат для получения оптимального результата.

Телефоны со встроенными камерами были взяты те, что оказались под рукой: пара Самсунгов с модулями 2 Mpx и смартфон SE P1i с камерой 3.2 Mpx. Самсунгами фотографии объектов делались вперемешку, SE P1i снимал со встроенной светодиодной вспышкой и без нее.

В качестве объектов было взято три обычных пресс-релиза, сложный для распознавания слегка помятый кусок газеты с мелким текстом и завалявшаяся в шкафу книжка с печатью средней паршивости на дешевой серой бумаге. Книжка была взята не случайно, в FineReader 9.0 заявлена интеллектуальная коррекция искажений, возникающих при фотосъемке книжного разворота.

Первый этап – достаточно небрежная съемка объектов без особых стараний получить качественное изображение. Но и без стараний что-то специально испортить. По принципу «что вышло – то вышло», скорее всего, именно так будет фотографировать текст человек, впервые столкнувшийся с подобной задачей. Снимки делались цветные и черно-белые, попытка повторялась, когда возникало ощущение неудачного кадра. В памяти смартфона случайно затесался снимок рекламной таблички в метро, заодно и этот кадр попал в тестовую коллекцию. Как впоследствии выяснилось, попал удачно.

Полученные файлы были обработаны в FineReader 8.0 в автоматическом режиме, получившийся документ сохранен в формате pdf. Результат работы Pentax Optio A30 можно посмотреть здесь (360 Кб), телефонов Samsung – здесь (240 Кб) и смартфона SE P1i – здесь (280 Кб). Pentax Optio A30 и FR 8.0 справились с задачей неплохо, съемка в черно-белом варианте оказалась удачнее. Но ошибок распознавания все равно многовато. Двухмегапиксельные модули Samsung выдали предсказуемый результат практической непригодности, хотя один пресс-релиз изумил неожиданно качественным итоговым документом. Видимо, попался какой-то особенно хорошо распознаваемый шрифт. Но рассчитывать на такую удачу явно не приходится. SE P1i расстроил в меру: определенный потенциал просматривается, есть за что побороться. Кстати, однозначное «табу» на использование вспышки: неравномерная засветка и блики катастрофически портят изображение. Обрезанное изображение в документе pdf – итог не совсем корректной работы программы FR 8.0 при вычленении рабочей области документа и сохранении в формат pdf листов альбомной ориентации.

Те же файлы после небольшой предварительной подготовки: вручную обозначены зоны текста и картинок. Pentax Optio, Samsung и SE P1i. Уже заметно лучше, 3.2 Mpx позволяют надеяться на приемлемый результат при съемке в черно-белом режиме без вспышки листов А4 с крупным текстом.

Теперь те же файлы без всякой предварительной подготовки загоним в новую, девятую версию FineReader. Pentax Optio, Samsung и SE P1i. Результат, как говорится, налицо: качество распознавания радикально улучшилось, особенно хорошо это видно на примере с SE P1i. Сохранение в pdf сработало почти идеально без всяких танцев с бубном вокруг настроек, тоже приятно. Проявились и некоторые любопытные особенности работы программы, об этом ниже.

Чего можно реально добиться

Наконец, заключительный этап эксперимента. Обретя некоторый опыт и поняв, как снимать не надо, изготавливаем одинаковый набор тестовых файлов для Pentax Optio, Samsung х820 и SE P1i. На этот раз стараемся сделать удачные снимки, хотя и без чрезмерного фанатизма с подбором освещения, максимально возможного заполнения кадра и т.п. Pentax Optio, Samsung и SE P1i. Вот теперь понятно, на что действительно можно рассчитывать. Pentax Optio отрабатывает неплохо, количество ошибок в пределах допустимого, и получающийся текст пригоден для употребления даже без правки. Встроенная камера 3.2 Mpx однозначно годится для съемки и распознавания офисных документов формата А4, при необходимости можно работать и с не мелким книжным текстом. Что-то более мелкое (газеты, журналы и т.п.) – как повезет. Встроенная камера 2 Mpx без автофокуса позволяет получать стабильно неплохие результаты при съемке офисных документов, это ее разумный предел. Если очень нужно, можно фотографировать и книжные страницы, но рассчитывать на хороший результат опасно.

Многое зависит от качества оптики встроенной камеры и наличия автофокуса, количество мегапикселей – не самое главное. Удачно зашел в гости товарищ со своим SE K750i (камера 2 Mpx с автофокусом), сделали пару снимков со стандартными настройками и при неважном освещении. Результат оказался неожиданно хорошим и при некотором старании наверняка оказался бы лучше, чем удалось добиться от модуля 3.2 Mpx в SE P1i.

Что изменилось в программе FineReader

Теперь о некоторых тонкостях работы с программой. Главная неожиданность – явно лучшее качество распознавания сложных текстовых объектов при съемке в цвете. Особенно заметно на участках текста с цветным фоном. При черно-белой съемке в автоматическом режиме программа частенько вообще игнорирует картинки, приходится обозначать эти блоки вручную. Еще один сюрприз – явно изменившийся алгоритм работы с картинками, программа приобрела дополнительный интеллект. Теперь FineReader не выискивает текстовые фрагменты в иллюстрациях и даже отказывается это делать в принудительном порядке (пример с рекламой в метро).

Заметное повышение качества распознавания достойно всяческих похвал, девятая версия – значительный шаг вперед, а не мелкие улучшения ради сбора денег за очередной апгрейд. Но чем разработчикам не угодил режим сканирования без распознавания – ума не приложу. Избавили тружеников офиса от лишней кнопки на панели инструментов для максимального упрощения процесса? Приятно, что при загрузке пакета графических файлов процесс распознавания всегда запускается автоматически, но порой это приводит к пустой трате времени. Типичный пример – документация с иллюстрациями в виде графиков, схем с пояснениями и т.п. Проще и быстрее сразу вручную несколькими кликами обозначить участки текст/иллюстрации на каждой странице и запустить распознавание. Теперь вместо этого приходится ждать, пока программа мучительно продерется через дебри мелкого шрифта на иллюстрациях, потом удалять автоматически созданные блоки на каждой странице, обозначать блоки вручную и опять запускать процесс распознавания. Так и не нашел в интерфейсе «выключатель» этой лишней (для меня) автоматики.

Судя по всему, максимальное поддерживаемое разрешение сканирования – 600 dpi, это предельная цифра в настройках. И даже с готовыми изображениями в большем разрешении FineReader работать не хочет, просит уменьшить разрешение до 600 dpi. Логичное решение с позиции «как бы чего не вышло», а то ведь неразумный пользователь запустит сканирование целой страницы в режиме 1200 dpi и подвесит компьютер файлом в 450 Мб. А как быть с небольшим участком мелкого, но вполне читабельного текста? Сканировать в графический редактор нужный фрагмент, делать скриншот и его распознавать? Срабатывает, но процесс получается долгий и муторный.

В процессе распознавания программа активно сверяет варианты со встроенными в нее словарями и подставляет подходящие по написанию слова. Если не проверять неуверенно распознанные участки, то получившийся текст может стать источником хорошего настроения: «Потел» вместо «Павел», полученный-домученный, получить-подучить и т.п.

Еще кое-какие «улучшения» и «усовершенствования» интерфейса не понравились при первом поверхностном знакомстве с продуктом, но это вопрос привыкания. Что касается работы программы в традиционном режиме сканирования бумажного оригинала, то здесь придраться трудно, разве что посетовать на резко выросший аппетит к системным ресурсам компьютера. Покопавшись в шкафу, нашел обзор четвертой версии FineReader-а десятилетней давности, ради эксперимента прогнал журнальную статью через FineReader 9.0. Вся процедура заняла минут 15-20, и результат порадовал, желающие вспомнить о «детских болезнях» популярного продукта могут взять текст здесь.

Резюме

Связка FineReader + Pentax Optio оказалась вполне работоспособной, этот блин комом не назовешь. Однако для нас с вами важнее другое: на рынке появился продукт, позволяющий реализовать потенциал встроенных в современные телефоны фотокамер. Причем реализовать на уровне реальной практической пользы, а не в качестве демонстрации возможностей в далеком будущем. Да, такая функциональность нужна далеко не всем, но те, кому она нужна, ее наверняка по достоинству оценят.

Обсуждение на форуме >>>

Сергей Потресов (sergey.potresov@mobile-review.com)
Опубликовано - 04 декабря 2007 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:
Hit

17.11.2017 Видео на канале: Первый взгляд на OPPO F5

17.11.2017 МТС снижает цену на спутниковое оборудование в два раза

17.11.2017 Philips E212A: телефон-раскладушка

17.11.2017 Сбербанк купил долю в разработчике технологий распознавания лиц

17.11.2017 ASUS ZenFone V Live – бюджетный смартфон из металла

17.11.2017 В России появится ещё одна технология бесконтактных платежей

16.11.2017 Состоялся официальный анонс смартфона OnePlus 5T

Hit

16.11.2017 Видео на канале: Обзор детских часов Hiper Babyguard

16.11.2017 Samsung открыл России доступ к голливудским хитам в сверхчетком качестве UltraHD HDR

16.11.2017 Минфин предложил запретить россиянам торговать на криптобиржах

16.11.2017 Infinix Zero 5 – смартфон с двумя основными камерами и оптическим зумом

16.11.2017 Появились пресс-рендеры модельного ряда смартфонов следующего года от Alcatel

16.11.2017 Motorola представила новый Moto Mods для смартфонов Moto Z – цветной принтер от Polaroid

Hit

15.11.2017 Видео на канале: Обзор Huawei Mate 10 Pro

Hit

15.11.2017 Видео на канале: Обзор Sony Xperia XZ1

15.11.2017 В России уже можно купить беспроводные фитнес-наушники Samsung Gear IconX (2018)

15.11.2017 MEIZU сертифицировали сервисы Google

15.11.2017 ProTruly Darling V11S – топовый VR смартфон из Китая за 1500$

15.11.2017 В GFXBench «засветился» новый смартфон среднего уровня Sony H3213 Avenger

15.11.2017 Яндекс научил Алису играть

Hit

14.11.2017 Видео на канале: Обзор фитнес браслета Fitbit ionic

14.11.2017 Leagoo T5c – недорогой смартфон с двумя камерами на топовом процессоре Spreadtrum

14.11.2017 HTC представила новый, полностью автономный, шлем виртуальной реальности – Vive Focus

Hit

14.11.2017 Официальное видео распаковки бестселлера BLUBOO S8+

14.11.2017 В бенчмарке Geekbench появились записи о Galaxy S9+

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.