- OCRopus
-
Эта статья или её секция содержит информацию о программном обеспечении, которое в данный момент находится в разработке. Содержимое статьи может значительно измениться в ходе разработки ПО.OCRopus Тип Разработчик Thomas Breuel, DFKI
Написана на Операционная система Первый выпуск 9 апреля 2007
Тестовая версия 0.4.4 (alpha) / 1 мая 2010
Лицензия Apache License v2.0
Сайт OCRopus — OCR-система на базе не так давно открытого распознающего ядра — tesseract Программный пакет для распознавания текста, развивающийся по принципам Open Source и распространяющееся под Apache License 2.0. По задумке разработчиков, с помощью OCRopus станет возможным определять текстовое содержимое на цифровых изображениях и переводить его в обычный текстовый формат для дальнейшего редактирования. Помимо печатного текста, программа сможет распознавать и рукописные материалы. По состоянию на альфа-релиз, OCRopus использует язык моделирования код из другого проекта поддерживаемого Google OpenFST. OCRopus в настоящее время доступна только для Linux, но существуют сборки и для Debian GNU/Hurd и Debian GNU/kFreeBSD.
Содержание
Использование
В настоящее время OCRopus использует только интерфейс командной строки, принимая указания на входные изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Если необходим более точный контроль, можно указать в командной строке команды для выполнения конкретных операций (например, распознание одной строки).
История развития
- 0.1.0 — Alpha — 22 Oct 2007
- 0.1.1 — 14 Dec 2007 — Улучшение системы сборки пакета
- 0.2 — Alpha 2 — 31 May 2008
- Beta — Scheduled for August 2008
- 1.0 — Scheduled for Q3 2008 — Пакеты для других операционных систем, +GUI
См. также
Ссылки
- OCRopus (официальная страница на Google Code)
- IUPR Publication Server (описание алгоритмов, используемых в OCRopus)
- OpenFST Официальный сайт
Программное обеспечение для оптического распознавания символов Свободное Графические интерфейсы Проприетарное Cognitive Forms • Expervision • FineReader • Microsoft Office Document Imaging • OmniPage • Readiris • ReadSoft • SimpleOCR • SmartScore • ViewWise
Категории:- Программное обеспечение в разработке
- Программное обеспечение по алфавиту
- Свободное программное обеспечение Google
- Свободное программное обеспечение оптического распознавания символов
- Программное обеспечение с лицензией Apache Software License
- Программное обеспечение для Linux
- Свободное программное обеспечение, написанное на C++
Wikimedia Foundation. 2010.