Введение
Совсем недавно мы рассматривали последнюю версию программы оптического распознавания текстовой информации ABBYY FineReader 9.0, которая вышла в октябре и привнесла в себе ряд новых технологий. В конце ноября 2007 года компания провела совместную конференцию с одним из ведущих производителей фототехники, компанией Pentax. На ней было объявлено о совместном проекте, в рамках которого прессе был представлен тандем из продуктов этих компаний, которые гармонично дополняют друг друга: АBBYY FineReader 9.0 и топовая компактная фотокамера Pentax Optio A30. У комплекта очень приятная цена – 9 000 руб., что намного ниже, чем покупать FineReader 9.0 и Pentax Optio A30 по отдельности (3 500 руб. и 8 000 руб., соответственно).
Кому нужен такой комплект? Ответом на этот вопрос были довольно интересные результаты совместных исследований специалистов ABBYY и Pentax. Они проанализировали уровень интереса к теме распознавания сфотографированных документов в электронных и печатных СМИ, а также в блогосфере. Кроме того, был проведён целый ряд исследований, опросов и маркетинговых акций. В результате было установлено, что около 60% пользователей цифровой фототехники активно используют режим съёмки текста и 47% заинтересованы в расширении не только функционального, но и программного оснащения фотокамер для обработки текстовой информации. Журналисты, студенты, школьники и многие другие используют иногда фотоаппарат в качестве “карманного сканера”. А впоследствии многим требуется извлечь и отредактировать сфотографированную информацию. Так почему бы и в самом деле не продавать комплект из программы распознавания оптических образов и фотоаппарата, подходящего на должность “карманного сканера”? Тем более, если он будет приятно стоить?
К нам в редакцию попал комплект из фотоаппарата Pentax Optio A30 с FineReader 9.0, и мы решили посмотреть его работу.
Почему же именно PENTAX Optio A30
В обзоре FineReader 9.0 мы уже рассказывали о том, насколько хорошо работает программа с текстом, сфотографированным даже при плохом освещении. Программисты компании хорошо поработали в этом направлении и добились распознавания фотографий, сделанных без предварительных настроек фотоаппарата и при плохом освещении. Наверное, это максимум того, что можно ожидать от современного ПО для распознавания оптических образов.
Но почему в качестве “карманного сканера” предлагается именно PENTAX Optio A30? Ведь на рынке и у самой Pentax существуют и другие модели, даже более дешёвые (стоимость Optio A30 находится в районе 8 000 рублей). Ответ кроется в нескольких отличительных особенностях данного фотоаппарата.
Прежде всего, стоит рассказать о “Shake Reduction” – технологии оптической стабилизации изображения. Данная технология позволяет компенсировать тряску рук, возникающую при съёмке без штатива. Если вы когда-нибудь фотографировали разворот учебника с расстояния, например, в один метр, или заметку в стенгазете, то, наверное, сталкивались с тем, что сложно различить текст из-за размытости символов. Это вызвано тряской рук, а увеличение усугубляет её ещё больше. В результате распознавание полученных снимков бывает некачественным или совсем не получается. Технология “Shake Reduction” компенсирует тряску рук, это чувствуется по полученным снимкам – при полном оптическом зуме без использования какой-либо твёрдой опоры фотографии сохраняют чёткость.
Данная модель от PENTAX обладает матрицей высокой чувствительности ISO 3200. Благодаря такой чувствительности качественная съёмка текста возможна даже при слабом освещении. Это будет полезно, если нужно сфотографировать огромное количество информации, а использование вспышки может быстро высадить батарею.
Optio А30 обладает довольно широкими возможностями. Программно обеспечивается множество режимов, в том числе специальный режим фотографирования текстовой информации.
Выбрав этот режим, вы отдельно сможете осуществить более точную настройку: чувствительность камеры к контрастности текста, сохранение текста в негативе, фотографирование цветного текста.
Конечно же, за такую цену Optima обладает впечатляющей для компактных моделей разрешающей способностью сенсора – 10 мегапикселей. Корме того, компактные размеры, большой экран и так далее. Подробнее вы можете прочитать о фотоаппарате на официальной странице.
Тестирование
В процессе тестирования мы старались максимально показать действие технологии оптической стабилизации изображения. Для этого мы ужесточили условия тестирования – плохое освещение и трясущиеся руки. Расстояние до объекта фотографирования превышало 1 метр, чтобы за счёт зума вибрация рук была более ощутимой. Мы намеренно не использовали вспышку – часто приходится экономить батарею, чтобы автономности хватило как можно дольше. Фотографировать при максимальном разрешении также не целесообразно – тогда всё упрётся не в батарею, а в место на карте памяти. Наш экземпляр Optio A30 был снабжён картой SD объёмом 512 Мбайт.
Итак, мы начали с того, что подобрали несколько страничек в одном из учебников, довольно старом, с пожелтевшими страницами. На страницах был как сплошной текст, так и таблицы (вспомним, как последняя версия FineReader отлично распознаёт документ “целиком”, со всеми объектами) и фотографировали одни и те же страницы с помощью Optio. Из настроек фотоаппарата мы меняли разрешение и качество снимков, а использовали при этом автоматический режим и режим “Текст”.
В первой попытке мы выставили разрешающую способность камеры на 3 МП, а качество на уровень два (из трёх). При этом на карту памяти поместился бы 661 снимок. Полученные фотографии представлены ниже.
Нажмите на картинку для увеличения.
Скриншот из FineReader 9.0 представлен ниже. Программа, конечно, выдала предупреждение о том, что следовало бы фотографировать с лучшими настройками качества. Однако всё было распознано довольно хорошо. Трудности возникли на месте сгиба страницы, но вряд ли тут можно пенять на фотоаппарат или на FineReader.
Нажмите на картинку для увеличения.
Затем мы попробовали самые “тяжёлые” настройки – минимальное качество и разрешение фотографий 1 024 х 768. При этом мы выставили режим монохромного текста с плохой контрастностью. Полученные снимки представлены ниже:
Нажмите на картинку для увеличения.
Программа также предложила улучшить качество снимков. В этом случае с распознаванием уже возникли проблемы. В основном, в таблицах. Автоматическое распознавание и конвертирование в Word дало результаты, показанные на скриншоте ниже.
Нажмите на картинку для увеличения.
Проблемы возникли с таблицами, однако сплошной текст был распознан нормально. В принципе, всё редактируемо, и то, что возникли проблемы с распознаванием, компенсируется тем, что на 512-Мбайт карту поместится целых 2 334 фотографии. Конечно, вряд ли вы будете снимать текст с такими настройками, поскольку качество слишком сильно падает. Однако, как показал тест, и это возможно. Мы считаем, что при лучшем внешнем освещении (как, например, в библиотеках) и съёмке без зума, снимки будут лучшего качества, а, следовательно, распознавание будет более эффективным. В любом случае, мы рекомендуем обзавестись более ёмкой картой памяти, благо, стоят они сегодня очень дёшево и по карману даже студенту.
Заключение
Совместная акция ABBYY и Pentax интересна, особенно если учесть цену, – за 9 000 рублей вы можете получить почти бесплатно ещё и коробочную версию лучшей программы для оптического распознавания. Неплохо, не так ли? Рекомендуем рассмотреть этот вариант при выборе подарков. Он будет полезен не только деловым людям, журналистам, но и студентам и школьникам в начинающейся четверти/семестре.