как из сканированного документа вытащить текст



Автор Ирина Короева задал вопрос в разделе Компьютеры, Связь

Как извлечь текст из сканированной страницы, чтобы не было рамки и чтобы чтобы править его в Worde? Пытаюсь это сделать и получил лучший ответ

Ответ от Дмитрий Соловьёв[гуру]
Так надо РАСПОЗНАВАНИЕ сделать!
"Recognize"

Ответ от Константин Биржаков[гуру]
Вот алгоритм действий.
1) Положить лист в сканер, сканировать как greyscale 300 dpi, можно дать небольшой шарп (повышение резкозти), но только слегка.
2) Сохраняем как TIFF.
3) Идем в ФайнРидер 8 -- открыть изображение.
4) Распознать.
5) Передать файл -- в Ворд.
**************
Почему может не распознаться?
Или убитый текст - факсовая копия, размытый оригинал, мелко-мелко написано.
Очень (подчеркиваю) очень часто в Ворд передается картинкой из-за низкого разрешения файла, то есть сканировалось с разрешением 72 dpi или типа того. СТАВЬ не ниже 300 dpi.
Или что-то не так делаешь.
Делай заново. Работает безотказно, проверено.

Ответ от Борис Ящук[мастер]
Нужно отсканированный текст, прежде чем сохранять-Р А С П О З Н А Т Ь, потому, что сканер читает любую бумажку как фото, естественно, это еще не текст.

Ответ от George_Z[гуру]
Ну, во-первых, читайте справку finreader'a, там есть даже обучение на примерах.
Справка - Обучение на примерах. ))
А так, действительно, после сканирования страницу надо сначала распознать (для этого есть отдельная кнопка на панели). После того как страница распознается в самом правом окошке (с заголовком текст) появится распознанный текст (который можно будет сразу же в этом окне править) Только после этого надо нажать на кнопку "Сохранить"
В-третьих, читайте справку
В-четвертых, читайте справку
ИТД
)).
А еще может быть, что при распознавании программа определила ваш текст не как текст, а как картинку. В таком случае вам надо в левом окне (с заголовком "Изображение") имеющиеся блок/блоки пометить как текст (правый клик по блоку - Изменить тип блока - Текст).

Ответ от Александр Ляшенко[гуру]
ВЫДЕЛЯЕШ ТЕКСТ(МОЖНО С КАРТИНКАМИ)копируеш,вставляеш в блокнот,сохраняеш,с блокнота копируеш куда угодно,чистый текст.Можно в блокноте сразу и отредактировать. а потом скопировать в Ворд

Ответ от Глеб[гуру]
Думаю лучше файн ридера не найти. Попробуй переустановить или что т о там не так делаешь. Сначала надо распознать, потом сохранить в ворд. Есть ещё один способ - с FR 8 устанавливается маленькая прога ABBYY Screenshot Reader так вот откраваешь картинку, запускаешь прогу, выбераешь формат файла, выделяешь часть картинки и делаешь снимок. Удачи.

Ответ от Пользователь удален[гуру]
Нажми роспознать!!

Ответ от Айдар[гуру]
Вообще-то сканер должен иметь такую функцию, как поддержка Wordа. В старых моделях этого нет. Мож Вам сканер новый приобрести.

Ответ от Andrey[гуру]
Сканировать надо не в JPEG а в PDF

Ответ от ЁТРАННИК[гуру]
Фиг знает, у меня на странице скана значок имеется - перевод в текстовый режим, что позволяет разделять текст, рисунки и картинки.

Ответ от 3 ответа[гуру]
Привет! Вот подборка тем с похожими вопросами и ответами на Ваш вопрос: Как извлечь текст из сканированной страницы, чтобы не было рамки и чтобы чтобы править его в Worde? Пытаюсь это сделать
 

Ответить на вопрос:

Имя*

E-mail:*

Текст ответа:*
Проверочный код(введите 22):*