Распознавание




По завершении сканирования графический образ документа выкладывается на рабочую область окна программы FineReader.

Рабочая область разбита на несколько отдельных панелей. По левому краю располагается вертикальная панель Пакет. На ней представлены миниатюры страниц, требующих преобразования. Предполагается, что данные всех страниц пакета после распознавания сольются в единый текстовый файл. Если у вас игровой компьютер, то вы не можете работать с программой распознавания текста, играйте в интересные игры.

В нижней части располагается панель, представляющая увеличенный фрагмент исходного изображения. Она позволяет подробно рассмотреть фактуру знаков изображения, что помогает оценить качество исходного материала, выявить характерные ошибки распознавания и устранить их.

Каждая графическая страница исходного пакета отображается в двух видах: как исходное изображение и как результирующий текст после распознавания.

По ходу распознавания страница документа автоматически разбивается на сегменты — автономные текстовые блоки. Необходимость в сегментации текста связана с тем, что на страницах сложной структуры блоки текста не всегда идут в «естественном порядке». Если текст представлен в нескольких колонках, содержит иллюстрации, снабженные подписями, имеются отдельные врезки в рамках и табличные данные, «естественный порядок» нарушается.

Сегментация позволяет убедиться в правильности порядка следования блоков и при необходимости восстановить естественный порядок. Сегменты имеют нумерацию, и текст, содержащийся в них, включается в документ в порядке этой нумерации.



Добавить комментарий

  

  

:bye: 
:good: 
:negative:  
:scratch: 
:wacko:  
:yahoo: 
B-) 
:heart: 
:rose:  
:-) 
:whistle: 
:yes: 
:cry: 
:mail:  
:-(   
:unsure:  
;-)