podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2

«Сладкая парочка» FineReader 9.0 + Pentax Optio и встроенные камеры

Новостной повод – начало продаж комплекта, фактическая тема – перспективы превращения цифровой фотографии в текстовый файл. Реальные технические проблемы, консерватизм пользователей или отсутствие информации?

Вместе дешевле

Причем намного дешевле. По крайней мере, в этом нас уверяют маркетологи уважаемой компании ABBYY. Цена комплекта (8999 руб.) заявлена ниже, чем розничная цена фотоаппарата Pentax Optio A30 (9100 руб.). Наверное, в магазинах эту камеру можно найти и купить за такие деньги, хотя price.ru нам дает ценовой диапазон реальных предложений 7700-8600 руб. Но цена пакета все равно выглядит неплохо, даже если ориентироваться на самые выгодные розничные предложения. На этом обсуждение финансового аспекта закончим и перейдем к более интересным темам.

Об истории развития и совершенствования систем распознавания текста можно написать целую книгу, тема чрезвычайно интересная. Продукт ABBYY традиционно хорош, компания по-моему уже лет пятнадцать специализируется на этом направлении. На российском рынке серьезных конкурентов программе FineReader не осталось, хотя когда-то существовала реальная альтернатива в виде программы Cuneiform компании Cognitive Technologies. Если не ошибаюсь, последняя версия Cuneiform вышла в 1999 или 2000 году. В эпоху развития электронного документооборота системам распознавания отведена ключевая роль, без них слишком много бумажных документов оказалось бы навсегда утрачено. До настоящего момента попыток официально «подружить» систему OCR (Optical Character Recognition – оптическое распознавание символов) с цифровой камерой я не припоминаю, программа традиционно работала в связке со сканером.

Впервые возможность работы с цифровым фото была официально анонсирована в FineReader 8.0, программу обучили автоматически исправлять геометрические искажения фотоснимка текста. Примерно год назад ради интереса попробовал, результат не вдохновил. Т.е. в принципе работало, но при наличии сканера особой практической пользы для себя не увидел. Лишняя морока, и слишком много ошибок пришлось бы исправлять вручную, в то время как отсканированные страницы распознаются почти безупречно. Однако времена меняются, и цифровая камера стала массовым продуктом, заставить FineReader прилично работать с цифровыми снимками очень заманчиво, и сразу резко расширяет круг потенциальных потребителей. Удалось ли разработчикам существенно повысить качество распознавания снимков? Было очень интересно сравнить, результаты ниже.

Еще один любопытный аспект – работоспособность системы распознавания в связке с мобильным телефоном. Тоже с год назад попробовал со встроенной камерой 1.3 Mpx и больше на эту тему даже не задумывался, уж слишком удручающим оказался итог эксперимента. Однако с тех пор двухмегапиксельные модули стали стандартом, трех и пяти – уже не редкость. Оптика встроенных камер тоже стала лучше, почему бы не поэкспериментировать с новой версией «распознавалки»?

Объекты, оборудование и порядок тестирования

Строго говоря, речь не идет о полноценном и всеобъемлющем тестировании продукта. Скорее это общий тест на работоспособность программы с разными источниками цифровых снимков, в том числе и с входящей в комплект камерой Pentax Optio A30. Данная модель камеры была выбрана не случайно, помимо маркетинговых, ценовых и т.п. соображений сыграло роль наличие нескольких режимов специально для фотографирования текста. Опции вынесены в отдельное подменю и позволяют парой-тройкой нажатий на джойстик сконфигурировать аппарат для получения оптимального результата.

Телефоны со встроенными камерами были взяты те, что оказались под рукой: пара Самсунгов с модулями 2 Mpx и смартфон SE P1i с камерой 3.2 Mpx. Самсунгами фотографии объектов делались вперемешку, SE P1i снимал со встроенной светодиодной вспышкой и без нее.

В качестве объектов было взято три обычных пресс-релиза, сложный для распознавания слегка помятый кусок газеты с мелким текстом и завалявшаяся в шкафу книжка с печатью средней паршивости на дешевой серой бумаге. Книжка была взята не случайно, в FineReader 9.0 заявлена интеллектуальная коррекция искажений, возникающих при фотосъемке книжного разворота.

Первый этап – достаточно небрежная съемка объектов без особых стараний получить качественное изображение. Но и без стараний что-то специально испортить. По принципу «что вышло – то вышло», скорее всего, именно так будет фотографировать текст человек, впервые столкнувшийся с подобной задачей. Снимки делались цветные и черно-белые, попытка повторялась, когда возникало ощущение неудачного кадра. В памяти смартфона случайно затесался снимок рекламной таблички в метро, заодно и этот кадр попал в тестовую коллекцию. Как впоследствии выяснилось, попал удачно.

Полученные файлы были обработаны в FineReader 8.0 в автоматическом режиме, получившийся документ сохранен в формате pdf. Результат работы Pentax Optio A30 можно посмотреть здесь (360 Кб), телефонов Samsung – здесь (240 Кб) и смартфона SE P1i – здесь (280 Кб). Pentax Optio A30 и FR 8.0 справились с задачей неплохо, съемка в черно-белом варианте оказалась удачнее. Но ошибок распознавания все равно многовато. Двухмегапиксельные модули Samsung выдали предсказуемый результат практической непригодности, хотя один пресс-релиз изумил неожиданно качественным итоговым документом. Видимо, попался какой-то особенно хорошо распознаваемый шрифт. Но рассчитывать на такую удачу явно не приходится. SE P1i расстроил в меру: определенный потенциал просматривается, есть за что побороться. Кстати, однозначное «табу» на использование вспышки: неравномерная засветка и блики катастрофически портят изображение. Обрезанное изображение в документе pdf – итог не совсем корректной работы программы FR 8.0 при вычленении рабочей области документа и сохранении в формат pdf листов альбомной ориентации.

Те же файлы после небольшой предварительной подготовки: вручную обозначены зоны текста и картинок. Pentax Optio, Samsung и SE P1i. Уже заметно лучше, 3.2 Mpx позволяют надеяться на приемлемый результат при съемке в черно-белом режиме без вспышки листов А4 с крупным текстом.

Теперь те же файлы без всякой предварительной подготовки загоним в новую, девятую версию FineReader. Pentax Optio, Samsung и SE P1i. Результат, как говорится, налицо: качество распознавания радикально улучшилось, особенно хорошо это видно на примере с SE P1i. Сохранение в pdf сработало почти идеально без всяких танцев с бубном вокруг настроек, тоже приятно. Проявились и некоторые любопытные особенности работы программы, об этом ниже.

Чего можно реально добиться

Наконец, заключительный этап эксперимента. Обретя некоторый опыт и поняв, как снимать не надо, изготавливаем одинаковый набор тестовых файлов для Pentax Optio, Samsung х820 и SE P1i. На этот раз стараемся сделать удачные снимки, хотя и без чрезмерного фанатизма с подбором освещения, максимально возможного заполнения кадра и т.п. Pentax Optio, Samsung и SE P1i. Вот теперь понятно, на что действительно можно рассчитывать. Pentax Optio отрабатывает неплохо, количество ошибок в пределах допустимого, и получающийся текст пригоден для употребления даже без правки. Встроенная камера 3.2 Mpx однозначно годится для съемки и распознавания офисных документов формата А4, при необходимости можно работать и с не мелким книжным текстом. Что-то более мелкое (газеты, журналы и т.п.) – как повезет. Встроенная камера 2 Mpx без автофокуса позволяет получать стабильно неплохие результаты при съемке офисных документов, это ее разумный предел. Если очень нужно, можно фотографировать и книжные страницы, но рассчитывать на хороший результат опасно.

Многое зависит от качества оптики встроенной камеры и наличия автофокуса, количество мегапикселей – не самое главное. Удачно зашел в гости товарищ со своим SE K750i (камера 2 Mpx с автофокусом), сделали пару снимков со стандартными настройками и при неважном освещении. Результат оказался неожиданно хорошим и при некотором старании наверняка оказался бы лучше, чем удалось добиться от модуля 3.2 Mpx в SE P1i.

Что изменилось в программе FineReader

Теперь о некоторых тонкостях работы с программой. Главная неожиданность – явно лучшее качество распознавания сложных текстовых объектов при съемке в цвете. Особенно заметно на участках текста с цветным фоном. При черно-белой съемке в автоматическом режиме программа частенько вообще игнорирует картинки, приходится обозначать эти блоки вручную. Еще один сюрприз – явно изменившийся алгоритм работы с картинками, программа приобрела дополнительный интеллект. Теперь FineReader не выискивает текстовые фрагменты в иллюстрациях и даже отказывается это делать в принудительном порядке (пример с рекламой в метро).

Заметное повышение качества распознавания достойно всяческих похвал, девятая версия – значительный шаг вперед, а не мелкие улучшения ради сбора денег за очередной апгрейд. Но чем разработчикам не угодил режим сканирования без распознавания – ума не приложу. Избавили тружеников офиса от лишней кнопки на панели инструментов для максимального упрощения процесса? Приятно, что при загрузке пакета графических файлов процесс распознавания всегда запускается автоматически, но порой это приводит к пустой трате времени. Типичный пример – документация с иллюстрациями в виде графиков, схем с пояснениями и т.п. Проще и быстрее сразу вручную несколькими кликами обозначить участки текст/иллюстрации на каждой странице и запустить распознавание. Теперь вместо этого приходится ждать, пока программа мучительно продерется через дебри мелкого шрифта на иллюстрациях, потом удалять автоматически созданные блоки на каждой странице, обозначать блоки вручную и опять запускать процесс распознавания. Так и не нашел в интерфейсе «выключатель» этой лишней (для меня) автоматики.

Судя по всему, максимальное поддерживаемое разрешение сканирования – 600 dpi, это предельная цифра в настройках. И даже с готовыми изображениями в большем разрешении FineReader работать не хочет, просит уменьшить разрешение до 600 dpi. Логичное решение с позиции «как бы чего не вышло», а то ведь неразумный пользователь запустит сканирование целой страницы в режиме 1200 dpi и подвесит компьютер файлом в 450 Мб. А как быть с небольшим участком мелкого, но вполне читабельного текста? Сканировать в графический редактор нужный фрагмент, делать скриншот и его распознавать? Срабатывает, но процесс получается долгий и муторный.

В процессе распознавания программа активно сверяет варианты со встроенными в нее словарями и подставляет подходящие по написанию слова. Если не проверять неуверенно распознанные участки, то получившийся текст может стать источником хорошего настроения: «Потел» вместо «Павел», полученный-домученный, получить-подучить и т.п.

Еще кое-какие «улучшения» и «усовершенствования» интерфейса не понравились при первом поверхностном знакомстве с продуктом, но это вопрос привыкания. Что касается работы программы в традиционном режиме сканирования бумажного оригинала, то здесь придраться трудно, разве что посетовать на резко выросший аппетит к системным ресурсам компьютера. Покопавшись в шкафу, нашел обзор четвертой версии FineReader-а десятилетней давности, ради эксперимента прогнал журнальную статью через FineReader 9.0. Вся процедура заняла минут 15-20, и результат порадовал, желающие вспомнить о «детских болезнях» популярного продукта могут взять текст здесь.

Резюме

Связка FineReader + Pentax Optio оказалась вполне работоспособной, этот блин комом не назовешь. Однако для нас с вами важнее другое: на рынке появился продукт, позволяющий реализовать потенциал встроенных в современные телефоны фотокамер. Причем реализовать на уровне реальной практической пользы, а не в качестве демонстрации возможностей в далеком будущем. Да, такая функциональность нужна далеко не всем, но те, кому она нужна, ее наверняка по достоинству оценят.

Обсуждение на форуме >>>

Сергей Потресов (sergey.potresov@mobile-review.com)
Опубликовано - 04 декабря 2007 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:

24.07.2017 Минкультуры предложило взимать авторский сбор с умных часов

24.07.2017 В сеть просочились «живые» фото защищенного смартфона Samsung Galaxy S8 Active

24.07.2017 UMIDIGI представила новый компактный смартфон – C2 с достаточно функциональной начинкой

21.07.2017 Facebook работает над модульным смартфоном

21.07.2017 iPhone получат L-образные аккумуляторы от LG

21.07.2017 Государственные сайты получат единый шрифт и оформление

21.07.2017 «Вконтакте» запустила десктопный мессенджер

21.07.2017 Банк Хоум Кредит запустил онлайн-площадку по оформлению товаров в рассрочку

21.07.2017 Закон о запрете анонимазайров принят Госдумой в окончательном чтении

Hit

21.07.2017 «Железная» составляющая ASUS Zenfone 3 Zoom

21.07.2017 LG Q8 – компактный флагман в металлическом водонепроницаемом корпусе и дополнительным дисплеем

21.07.2017 Qualcomm лишилась 40% прибыли из-за конфликта с Apple

21.07.2017 Новый закон о мессенджерах позволит блокировать отдельных пользователей по решению суда

21.07.2017 23 августа Samsung представит новый Galaxy Note

20.07.2017 В России стартовали продажи компактного безрамочного смартфона DOOGEE MIX с двойной камерой

20.07.2017 JP Morgan: iPhone 8 выйдет вовремя, но ограниченной партией

20.07.2017 Консоли Sega и Atari поступят в магазины осенью

20.07.2017 Amazon Spark - соцсеть для совершения покупок

20.07.2017 AliExpress принимает платежи через систему «Мир»

20.07.2017 Чистая прибыль ZTE за шесть месяцев увеличилась на 29,9% 

20.07.2017 Состоялся российский анонс фитнес-трекера Honor Band 3 от Huawei

Hit

20.07.2017 Компания BLUBOO продемонстрировала дизайн нового смартфона BLUBOO S8

20.07.2017 AliExpress ведёт переговоры о развитии в России собственной сети

20.07.2017 Для поклонников второго Терминатора выйдет коллекционное издание фильма на Blu-Ray в 3D, 4K и с рукой робота

20.07.2017 «Вымпелком» закроет около 200 салонов после сделки по разделу «Евросети»

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.