«Сладкая парочка» FineReader 9.0 + Pentax Optio и встроенные камеры

Новостной повод – начало продаж комплекта, фактическая тема – перспективы превращения цифровой фотографии в текстовый файл. Реальные технические проблемы, консерватизм пользователей или отсутствие информации?

Вместе дешевле

Причем намного дешевле. По крайней мере, в этом нас уверяют маркетологи уважаемой компании ABBYY. Цена комплекта (8999 руб.) заявлена ниже, чем розничная цена фотоаппарата Pentax Optio A30 (9100 руб.). Наверное, в магазинах эту камеру можно найти и купить за такие деньги, хотя price.ru нам дает ценовой диапазон реальных предложений 7700-8600 руб. Но цена пакета все равно выглядит неплохо, даже если ориентироваться на самые выгодные розничные предложения. На этом обсуждение финансового аспекта закончим и перейдем к более интересным темам.

Об истории развития и совершенствования систем распознавания текста можно написать целую книгу, тема чрезвычайно интересная. Продукт ABBYY традиционно хорош, компания по-моему уже лет пятнадцать специализируется на этом направлении. На российском рынке серьезных конкурентов программе FineReader не осталось, хотя когда-то существовала реальная альтернатива в виде программы Cuneiform компании Cognitive Technologies. Если не ошибаюсь, последняя версия Cuneiform вышла в 1999 или 2000 году. В эпоху развития электронного документооборота системам распознавания отведена ключевая роль, без них слишком много бумажных документов оказалось бы навсегда утрачено. До настоящего момента попыток официально «подружить» систему OCR (Optical Character Recognition – оптическое распознавание символов) с цифровой камерой я не припоминаю, программа традиционно работала в связке со сканером.

Впервые возможность работы с цифровым фото была официально анонсирована в FineReader 8.0, программу обучили автоматически исправлять геометрические искажения фотоснимка текста. Примерно год назад ради интереса попробовал, результат не вдохновил. Т.е. в принципе работало, но при наличии сканера особой практической пользы для себя не увидел. Лишняя морока, и слишком много ошибок пришлось бы исправлять вручную, в то время как отсканированные страницы распознаются почти безупречно. Однако времена меняются, и цифровая камера стала массовым продуктом, заставить FineReader прилично работать с цифровыми снимками очень заманчиво, и сразу резко расширяет круг потенциальных потребителей. Удалось ли разработчикам существенно повысить качество распознавания снимков? Было очень интересно сравнить, результаты ниже.

Еще один любопытный аспект – работоспособность системы распознавания в связке с мобильным телефоном. Тоже с год назад попробовал со встроенной камерой 1.3 Mpx и больше на эту тему даже не задумывался, уж слишком удручающим оказался итог эксперимента. Однако с тех пор двухмегапиксельные модули стали стандартом, трех и пяти – уже не редкость. Оптика встроенных камер тоже стала лучше, почему бы не поэкспериментировать с новой версией «распознавалки»?

Объекты, оборудование и порядок тестирования

Строго говоря, речь не идет о полноценном и всеобъемлющем тестировании продукта. Скорее это общий тест на работоспособность программы с разными источниками цифровых снимков, в том числе и с входящей в комплект камерой Pentax Optio A30. Данная модель камеры была выбрана не случайно, помимо маркетинговых, ценовых и т.п. соображений сыграло роль наличие нескольких режимов специально для фотографирования текста. Опции вынесены в отдельное подменю и позволяют парой-тройкой нажатий на джойстик сконфигурировать аппарат для получения оптимального результата.

Телефоны со встроенными камерами были взяты те, что оказались под рукой: пара Самсунгов с модулями 2 Mpx и смартфон SE P1i с камерой 3.2 Mpx. Самсунгами фотографии объектов делались вперемешку, SE P1i снимал со встроенной светодиодной вспышкой и без нее.

В качестве объектов было взято три обычных пресс-релиза, сложный для распознавания слегка помятый кусок газеты с мелким текстом и завалявшаяся в шкафу книжка с печатью средней паршивости на дешевой серой бумаге. Книжка была взята не случайно, в FineReader 9.0 заявлена интеллектуальная коррекция искажений, возникающих при фотосъемке книжного разворота.

Первый этап – достаточно небрежная съемка объектов без особых стараний получить качественное изображение. Но и без стараний что-то специально испортить. По принципу «что вышло – то вышло», скорее всего, именно так будет фотографировать текст человек, впервые столкнувшийся с подобной задачей. Снимки делались цветные и черно-белые, попытка повторялась, когда возникало ощущение неудачного кадра. В памяти смартфона случайно затесался снимок рекламной таблички в метро, заодно и этот кадр попал в тестовую коллекцию. Как впоследствии выяснилось, попал удачно.

Полученные файлы были обработаны в FineReader 8.0 в автоматическом режиме, получившийся документ сохранен в формате pdf. Результат работы Pentax Optio A30 можно посмотреть здесь (360 Кб), телефонов Samsung – здесь (240 Кб) и смартфона SE P1i – здесь (280 Кб). Pentax Optio A30 и FR 8.0 справились с задачей неплохо, съемка в черно-белом варианте оказалась удачнее. Но ошибок распознавания все равно многовато. Двухмегапиксельные модули Samsung выдали предсказуемый результат практической непригодности, хотя один пресс-релиз изумил неожиданно качественным итоговым документом. Видимо, попался какой-то особенно хорошо распознаваемый шрифт. Но рассчитывать на такую удачу явно не приходится. SE P1i расстроил в меру: определенный потенциал просматривается, есть за что побороться. Кстати, однозначное «табу» на использование вспышки: неравномерная засветка и блики катастрофически портят изображение. Обрезанное изображение в документе pdf – итог не совсем корректной работы программы FR 8.0 при вычленении рабочей области документа и сохранении в формат pdf листов альбомной ориентации.

Те же файлы после небольшой предварительной подготовки: вручную обозначены зоны текста и картинок. Pentax Optio, Samsung и SE P1i. Уже заметно лучше, 3.2 Mpx позволяют надеяться на приемлемый результат при съемке в черно-белом режиме без вспышки листов А4 с крупным текстом.

Теперь те же файлы без всякой предварительной подготовки загоним в новую, девятую версию FineReader. Pentax Optio, Samsung и SE P1i. Результат, как говорится, налицо: качество распознавания радикально улучшилось, особенно хорошо это видно на примере с SE P1i. Сохранение в pdf сработало почти идеально без всяких танцев с бубном вокруг настроек, тоже приятно. Проявились и некоторые любопытные особенности работы программы, об этом ниже.

Чего можно реально добиться

Наконец, заключительный этап эксперимента. Обретя некоторый опыт и поняв, как снимать не надо, изготавливаем одинаковый набор тестовых файлов для Pentax Optio, Samsung х820 и SE P1i. На этот раз стараемся сделать удачные снимки, хотя и без чрезмерного фанатизма с подбором освещения, максимально возможного заполнения кадра и т.п. Pentax Optio, Samsung и SE P1i. Вот теперь понятно, на что действительно можно рассчитывать. Pentax Optio отрабатывает неплохо, количество ошибок в пределах допустимого, и получающийся текст пригоден для употребления даже без правки. Встроенная камера 3.2 Mpx однозначно годится для съемки и распознавания офисных документов формата А4, при необходимости можно работать и с не мелким книжным текстом. Что-то более мелкое (газеты, журналы и т.п.) – как повезет. Встроенная камера 2 Mpx без автофокуса позволяет получать стабильно неплохие результаты при съемке офисных документов, это ее разумный предел. Если очень нужно, можно фотографировать и книжные страницы, но рассчитывать на хороший результат опасно.

Многое зависит от качества оптики встроенной камеры и наличия автофокуса, количество мегапикселей – не самое главное. Удачно зашел в гости товарищ со своим SE K750i (камера 2 Mpx с автофокусом), сделали пару снимков со стандартными настройками и при неважном освещении. Результат оказался неожиданно хорошим и при некотором старании наверняка оказался бы лучше, чем удалось добиться от модуля 3.2 Mpx в SE P1i.

Что изменилось в программе FineReader

Теперь о некоторых тонкостях работы с программой. Главная неожиданность – явно лучшее качество распознавания сложных текстовых объектов при съемке в цвете. Особенно заметно на участках текста с цветным фоном. При черно-белой съемке в автоматическом режиме программа частенько вообще игнорирует картинки, приходится обозначать эти блоки вручную. Еще один сюрприз – явно изменившийся алгоритм работы с картинками, программа приобрела дополнительный интеллект. Теперь FineReader не выискивает текстовые фрагменты в иллюстрациях и даже отказывается это делать в принудительном порядке (пример с рекламой в метро).

Заметное повышение качества распознавания достойно всяческих похвал, девятая версия – значительный шаг вперед, а не мелкие улучшения ради сбора денег за очередной апгрейд. Но чем разработчикам не угодил режим сканирования без распознавания – ума не приложу. Избавили тружеников офиса от лишней кнопки на панели инструментов для максимального упрощения процесса? Приятно, что при загрузке пакета графических файлов процесс распознавания всегда запускается автоматически, но порой это приводит к пустой трате времени. Типичный пример – документация с иллюстрациями в виде графиков, схем с пояснениями и т.п. Проще и быстрее сразу вручную несколькими кликами обозначить участки текст/иллюстрации на каждой странице и запустить распознавание. Теперь вместо этого приходится ждать, пока программа мучительно продерется через дебри мелкого шрифта на иллюстрациях, потом удалять автоматически созданные блоки на каждой странице, обозначать блоки вручную и опять запускать процесс распознавания. Так и не нашел в интерфейсе «выключатель» этой лишней (для меня) автоматики.

Судя по всему, максимальное поддерживаемое разрешение сканирования – 600 dpi, это предельная цифра в настройках. И даже с готовыми изображениями в большем разрешении FineReader работать не хочет, просит уменьшить разрешение до 600 dpi. Логичное решение с позиции «как бы чего не вышло», а то ведь неразумный пользователь запустит сканирование целой страницы в режиме 1200 dpi и подвесит компьютер файлом в 450 Мб. А как быть с небольшим участком мелкого, но вполне читабельного текста? Сканировать в графический редактор нужный фрагмент, делать скриншот и его распознавать? Срабатывает, но процесс получается долгий и муторный.

В процессе распознавания программа активно сверяет варианты со встроенными в нее словарями и подставляет подходящие по написанию слова. Если не проверять неуверенно распознанные участки, то получившийся текст может стать источником хорошего настроения: «Потел» вместо «Павел», полученный-домученный, получить-подучить и т.п.

Еще кое-какие «улучшения» и «усовершенствования» интерфейса не понравились при первом поверхностном знакомстве с продуктом, но это вопрос привыкания. Что касается работы программы в традиционном режиме сканирования бумажного оригинала, то здесь придраться трудно, разве что посетовать на резко выросший аппетит к системным ресурсам компьютера. Покопавшись в шкафу, нашел обзор четвертой версии FineReader-а десятилетней давности, ради эксперимента прогнал журнальную статью через FineReader 9.0. Вся процедура заняла минут 15-20, и результат порадовал, желающие вспомнить о «детских болезнях» популярного продукта могут взять текст здесь.

Резюме

Связка FineReader + Pentax Optio оказалась вполне работоспособной, этот блин комом не назовешь. Однако для нас с вами важнее другое: на рынке появился продукт, позволяющий реализовать потенциал встроенных в современные телефоны фотокамер. Причем реализовать на уровне реальной практической пользы, а не в качестве демонстрации возможностей в далеком будущем. Да, такая функциональность нужна далеко не всем, но те, кому она нужна, ее наверняка по достоинству оценят.

Обсуждение на форуме >>>

Сергей Потресов ([email protected])
Опубликовано - 04 декабря 2007 г.

Есть, что добавить?! Пишите... [email protected]

 
Новости:

13.05.2021 MediaTek представила предфлагманский чипсет Dimensity 900 5G

13.05.2021 Cайты, имеющие 500 тысяч пользователей из России, должны будут открыть местные филиалы

13.05.2021 Amazon представила обновления своих умных дисплеев Echo Show 8 и Echo Show 5

13.05.2021 МТС ввел удобный тариф без абонентской платы - «МТС Нон-стоп»

13.05.2021 Zenfone 8 Flip – вариант Galaxy A80 от ASUS

13.05.2021 Поставки мониторов в этом году достигнут 150 млн

13.05.2021 Состоялся анонс модной версии «умных» часов Samsung Galaxy Watch3 TOUS

13.05.2021 Tele2 выходит на Яндекс.Маркет

13.05.2021 OPPO представила чехол для смартфона, позволяющий управлять устройствами умного дома

13.05.2021 TWS-наушники с активным шумоподавлением Xiaomi FlipBuds Pro

13.05.2021 В России до конца следующего года появится госстандарт для искусственного интеллекта

13.05.2021 ASUS Zenfone 8 – компактный флагман на Snapdragon 888

12.05.2021 Компания Genesis представила внешность своего первого универсала G70 Shooting Brake

12.05.2021 В России разработан высокоточный гироскоп для беспилотников

12.05.2021 В Россию привезли новую версию смарт-часов HUAWEI WATCH FIT, Elegant Edition

12.05.2021 Раскрыты ключевые особенности смартфона POCO M3 Pro 5G

12.05.2021 Honor 50: стали известны дизайн и другие подробности о смартфоне

12.05.2021 Чипсет Exynos 2200 от Samsung будет устанавливаться и в смартфоны, и в ноутбуки

12.05.2021 МТС начала подключать многоквартирные дома к интернету вещей

12.05.2021 iPhone 13 будет толще и получит более крупные камеры по сравнению с iPhone 12

12.05.2021 Xiaomi договорилась с властями США об исключении из чёрного списка

12.05.2021 Xiaomi выпустила обновлённую версию умного пульта Agara Cube T1 Pro

Hit

12.05.2021 Игровые ноутбуки с NVIDIA GeForce RTX 3050 Ti уже в России!

12.05.2021 Индийский завод Foxconn сократил производство в два раза

12.05.2021 Lenovo отказалась от очного участия в предстоящем в июне Mobile World Congress

Подписка
 
© Mobile-review.com, 2002-2021. All rights reserved.