manuscript-ocr
Описание
Языки
- Jupyter Notebook91,7%
- Python8,3%
месяц назад
11 дней назад
11 дней назад
12 дней назад
11 дней назад
11 дней назад
13 дней назад
3 месяца назад
5 месяцев назад
10 дней назад
11 дней назад
4 месяца назад
11 дней назад
README.md
Manuscript OCR
Manuscript OCR – открытый Python-фреймворк полного OCR/HTR-пайплайна для распознавания дореформенных рукописей на русском языке XVIII–XIX веков и современных текстов. Проект направлен на цифровизацию и анализ исторического текстового наследия с использованием разработанных методов, учитывающих устаревшую орфографию, сложную структуру страниц и вариативность почерков, и обеспечивающих высокую вычислительную эффективность на ограниченных ресурсах.
Онлайн-демо - попробовать Manuscript OCR в браузере
Полная документация - English & Русский
Установка
Минимальный пример
Дополнительные варианты установки
Для ускорения на GPU (NVIDIA CUDA)
Для Apple Silicon (M1/M2/M3) с CoreML
Dev-установка с обучением моделей
Dev-установка для обучения на GPU (NVIDIA CUDA)
Примечание: GPU версии (ONNX Runtime GPU и PyTorch CUDA) пользователь устанавливает вручную по необходимости.
Использование GPU/CoreML
Связанные работы
- Sherstnev, P.A.; Kozhin, K.D.; Pyataeva, A.V. Analyzing the Influence of Hyperparameters on the Efficiency of an OCR Model for Pre-Reform Handwritten Texts. Program Comput Soft 51, 173–180 (2025). https://doi.org/10.1134/S0361768825700069
- Шерстнев, П. А.; Кожин, К. Д.; Пятаева, А. В. Анализ влияния гиперпараметров на эффективность OCR-модели для дореформенных рукописных текстов // Программирование. – 2025. – № 3. – С. 70-79. – DOI 10.31857/S0132347425030071. – EDN GRLAPG.
- Шерстнев, П. А.; Кожин, К. Д.; Пятаева, А. В. Распознавание рукописных текстов отчетов губернаторов Енисейской губернии 19 века // GraphiCon 2024 : Материалы 34-й Международной конференции по компьютерной графике и машинному зрению, Омск, 17–19 сентября 2024 года. – Омск: Омский государственный технический университет, 2024. – С. 519-524. – DOI 10.25206/978-5-8149-3873-2-2024-519-524. – EDN GBEKEZ.
Проект реализован при поддержке гранта
Фонд содействия инновациям, конкурс «Код-ИИ», VII очередь