Средства распознавания текстов

Нас в первую очередь интересуют программы, ориентированные на распознавание текста на русском языке (а также на некоторых других языках). Соответственно, они выпускаются отечественными производителями. Наиболее популярные программы этой категории — CuneiForm (разработка компании Cognitive Technologies) и FineReader. Они используют разные алгоритмы распознавания и несколько различаются по методике работы и удобству использования. Мы остановимся на программе FineReader как завоевавшей наибольшую популярность.

Как правило, такими программами комплектуют сканеры средней и высшей ценовых категорий, продаваемые в нашей стране. На рынке также представлены версии программ распознавания текстов, рассчитанные на домашнее применение. Для серьезной работы рекомендуется приобретать профессиональные версии программ.

Программа FineReader выпускается российской компанией ABBYY Software (www.abbyy.com). Программа способна сканировать документы с последующим распознаванием текстов на русском, украинском, английском, немецком, французском и многих других языках, а также документы со смешанными двуязычными текстами.

Особенности программы FineReader заключаются в объединении сканирования страницы и распознавания текста в единой операции, в возможности работы с пакетами изображений заранее отсканированных страниц, а также в наличии режима «обучения», что позволяет повысить качество распознавания сложных шрифтов или документов низкого качества. Программа автоматически проверяет орфографию в распознанном тексте и позволяет редактировать его в интерактивном режиме. Мы познакомимся с методикой оцифровки бумажных документов на примере программы FineReader Professional Edition восьмой версии.



  1. 5
  2. 4
  3. 3
  4. 2
  5. 1

(0 голосов, в среднем: 0 из 5)

 

Leave a Reply