ocr
Описание
Распознавание текста с использованием Tesseract OCR
Языки
- Python100%
README.md
Для работы со скриптом на Ubuntu тебе нужно установить Tesseract OCR и библиотеку pytesseract для Python.
Вот пошаговая инструкция:
1. Установка Tesseract OCR
Открой терминал и выполни команду:
Проверить успешную установку можно командой:
2. Установка языкового пакета для русского языка
Tesseract поддерживает разные языки, но по умолчанию установлен только английский. Добавляем русский:
Проверить, какие языки установлены:
В списке должен быть rus.
3. Установка библиотеки для Python
Активируем виртуальное окружение (по желанию):
Затем устанавливаем pytesseract и Pillow (для работы с изображениями):
4. Проверка работоспособности
Запусти Python и попробуй выполнить:
Если всё установлено правильно, в выводе должен появиться список доступных языков, включая rus.
Теперь можешь запускать скрипт.