- OCRFeeder
-
OCRFeeder Тип Автор Joaquim Rocha
Разработчик компания Igalia, S.L.[1]
Написана на Интерфейс Операционная система Linux и др. UNIX-подобные
Первый выпуск май 2009[2]
Последняя версия 0.7.9 (11 апреля 2012[3])
Состояние активное
Лицензия Сайт OCRFeeder — программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm, Tesseract, GOCR (англ.) и Ocrad (англ.). OCRFeeder является свободно распространяемой программой для операционной системы Linux.
Содержание
Функции
- Графические форматы ввода данных: PNG, JPEG, BMP, TIFF, GIF, Portable anymap (PNM, PGM, PBM, PPM) и другие. Импорт PDF-файлов.
- Форматы вывода данных: текстовый файл, ODT, HTML, PDF.
- Обработка изображений для улучшения качества распознавания — фильтры шумов, чёрного цвета и оттенков серого; и другие виды обработок, доступных для Unpaper[4].
- Ручное выделение блоков на странице.
- Проверка орфографии.
- Получение изображений со сканера посредством программы SANE.
- Распознавание нескольких изображений по порядку за один проход (пакетное распознавание).
Используемые компоненты
- PIL — библиотека Python для работы с изображениями.
- Unpaper — для обработки изображений.
- ReportLab[5] — для импорта PDF-файлов.
- PyGTK и Libgnome — для графического интерфейса.
- PyeEnchant («привязка» Enchant (англ.) для Python) и PyGtkSpell («привязка» GtkSpell для Python) — для проверки орфографии.
Примечания
Литература
- Журнал Linux Format № 11 (150) Ноябрь 2011 — Тимур Мубаракшин рассматривает приложения OCR для Linux: Сuneiform-Qt, GOCR, Tesseract, OCRFeeder, ABBYY FineReader и YAGF.
Ссылки
- Домашняя страница OCRFeeder на сайте проекта GNOME.
- Домашняя страница OCRFeeder на сайте разработчика — компании Igalia, S.L.
Программное обеспечение для оптического распознавания символов Свободное Графические интерфейсы OCRFeeder • YAGF
Проприетарное Cognitive Forms • Expervision • FineReader • Microsoft Office Document Imaging • OmniPage • Readiris • ReadSoft • SimpleOCR • SmartScore • ViewWise
Проект GNOME Сообщество Люди Компоненты Приложения
(список)Технологии Категории:- Программное обеспечение по алфавиту
- Свободное программное обеспечение оптического распознавания символов
- Свободное программное обеспечение, написанное на Python
- GNOME
Wikimedia Foundation. 2010.