ocr

0

Описание

Распознавание текста с использованием Tesseract OCR

Языки

  • Python100%
год назад
год назад
README.md

Для работы со скриптом на Ubuntu тебе нужно установить Tesseract OCR и библиотеку pytesseract для Python.

Вот пошаговая инструкция:

1. Установка Tesseract OCR

Открой терминал и выполни команду:

Проверить успешную установку можно командой:

2. Установка языкового пакета для русского языка

Tesseract поддерживает разные языки, но по умолчанию установлен только английский. Добавляем русский:

Проверить, какие языки установлены:

В списке должен быть rus.

3. Установка библиотеки для Python

Активируем виртуальное окружение (по желанию):

Затем устанавливаем pytesseract и Pillow (для работы с изображениями):

4. Проверка работоспособности

Запусти Python и попробуй выполнить:

Если всё установлено правильно, в выводе должен появиться список доступных языков, включая rus.

Теперь можешь запускать скрипт.