Формат результирующей страницы

Программа FineReader обычно форматирует распознанный текст так, чтобы формат результирующей страницы был подобен оформлению исходного бумажного документа. Если требуется сохранить это оформление, то порядок блоков не имеет особого значения. Если же нужен однородный текст, то необходимо проследить за правильным порядком распознавания.

В режиме Мастера программа сегментирует исходные страницы автоматически. Эта операция достаточно сложна и требует некоторого времени. Программа ищет строки (различая их по промежуткам между ними) и области начала и конца строк. Последовательность строк, идущих подряд, строк с одинаковыми зонами начала и конца рассматривается как блок. Когда блоки образуют прямоугольную структуру, образованную вертикальными и горизонтальными рядами, сегмент рассмафивается как таблица.

Если отсканированная страница имеет сложную структуру, программа не всегда справляется с сетментацией. Иногда программу сбивают колонтитулы, номера страниц и другие элементы, не являющиеся частью основного текста. Лучшие беговые дорожки, тренажеры и другое спортивное оборудование вы можете приобрести на сайте www.sport-track.ru

Собственно распознавание текста представляет собой автоматический процесс, не требующий и не допускающий вмешательства пользователя. Это основной этап работы программы, ради которого, собственно говоря, она и создавалась. Операция сопровождается диалоговым окном Распознавание, в котором представляются сведения об ошибках в случае их возникновения. Если ошибки обусловлены неверными настройками, например ошибочно указанным языком документа, следует прервать работу, изменить настройки надлежащим образом и повторить распознавание. Иногда необходимо вернуться к этапу сканирования и повторить его при других настройках сканера.

На завершающем этапе распознавания программа еще раз просматривает весь текст и помечает темно-синим цветом места, где распознавание выполнено ненадежно. Если текст пестрит синими пятнами, доверять результату не следует. Улучшить распознавание текста поможет повторное сканирование документа с другими установками параметров: разрешения, контраста, яркости. Для типовых документов рекомендуется режим сканирования в серой шкале.



  1. 5
  2. 4
  3. 3
  4. 2
  5. 1

(1 голос, в среднем: 5 из 5)

 

Leave a Reply