Как сканировать документ и редактировать текст

Допустим, у вас есть много письменных заметок, которые вы хотите перенести в компьютерный файл и время от времени редактировать. Вы можете набрать данные вручную, но есть более быстрый способ. Вы можете сканировать документ и автоматически преобразовывать слова в компьютерные буквы и слова, которые можно редактировать. Для этого вам понадобится программное обеспечение для оптического распознавания символов (OCR).

Использование программного обеспечения для оптического распознавания текста со сканером

Шаг 1

Откройте программу оптического распознавания текста, чтобы она была готова принять новые отсканированные файлы.

Видео дня

Шаг 2

Отсканируйте документ на свой компьютер. Убедитесь, что страница, которую вы хотите отсканировать, максимально четкая, с темными чернилами, чтобы сканер мог уловить каждое слово. Если произведение написано от руки, а не напечатано, слова должны быть напечатаны (написаны отдельными, несвязанными букв), если это вообще возможно, так как многим программам OCR трудно расшифровать рукописный (скорописный) почерк.

Шаг 3

Выберите желаемый вариант вывода (например, RTF, Word, PowerPoint, Excel, текст или PDF), позвольте программе OCR выполнить преобразование, а затем сохраните преобразованный файл на жесткий диск.

Шаг 4

Запустите программу обработки текста для файла, который вы только что преобразовали. Откройте файл и отредактируйте документ. В зависимости от качества сканирования и программного обеспечения оптического распознавания символов вам может потребоваться обширное редактирование (например, «ri» могло быть ошибочно переведено как «n»). Не выключайте проверку правописания во время редактирования, чтобы выявить все ошибки.

Путь Google

Шаг 1

У Google также есть встроенная система распознавания текста. Всякий раз, когда вы находите в поисковой системе Google веб-сайт, который напрямую связан с файлом PDF, у вас есть возможность прочитать его как в формате PDF, так и в формате HTML (текст). Итак, для начала отсканируйте свой документ.

Шаг 2

Конвертируйте документ в PDF. Вы можете сделать это, просто сохранив изображение в виде файла PDF в своем программном обеспечении для редактирования изображений (например, Adobe Photoshop). Или, на Mac с OSX, нажмите «Печать» и нажмите «Сохранить как PDF».

Шаг 3

Загрузите файл PDF в свою учетную запись хостинга веб-сайта (или вы можете использовать бесплатную службу хостинга веб-сайтов, такую ​​как Geocities) и сделать файл общедоступным. Обратите внимание на точный веб-адрес файла PDF.

Шаг 4

Отправьте адрес ссылки в Google Submit (см. Ресурсы), чтобы он был проиндексирован и отображался в результатах поиска Google (это может занять пару дней).

Шаг 5

Найдите свой PDF-файл в поисковой системе Google, введя точную веб-ссылку на PDF-файл. Выберите вариант, чтобы загрузить его как файл HTML.

ШАГ 6

Скопируйте и вставьте текст из своего HTML-файла в Microsoft Word или другой текстовый редактор для редактирования.

Вещи, которые вам понадобятся

  • Программное обеспечение OCR

  • Сканер

  • Программное обеспечение для редактирования изображений

  • Учетная запись веб-хостинга

Подсказка

В некоторые сканеры встроено программное обеспечение OCR, которое автоматически преобразует отсканированное изображение в редактируемый текстовый файл.

Если вам нужно преобразовать много отсканированных страниц в текст, приобретите сканер с автоподатчиком (похожий на принтер). См. "Ресурсы" для примера одного из этих устройств.