- Microsoft Office Document Imaging
-
- см. также Microsoft Document Imaging Format
Microsoft Office Document Imaging (MODI) входит в состав пакета Microsoft Office для поддержки редактирования документов, отсканированных в Microsoft Office Document Scanning. Впервые появился в Microsoft Office XP и включался в поздние версии офиса, включая Office 2007. Более не доступен в Office 2010. MODI позволяет распознавать отсканированные документы.
MODI может читать и писать небольшие изображения формата TIFF. Он также может сохранять распознанный текст в оригинальный TIFF файл. Однако, MODI создаёт .tif файлы которые нарушают стандартны формата TIFF[1] и они могут быть использованы только в пакете Microsoft Office[2].
По умолчанию, движок OCR требует правильной ориентации страницы при распознавании. Если вызвать метод objectname.save(), он может записать исправленное положение страницы в исходный файл.
Точность распознавания этого движка невысокая, и для серьёзного применения он мало годится. К тому же он предъявляет высокие требования к качеству входных изображений.
Содержание
Программирование
Через интерфейс COM, MODI предоставляет интерфейс объектной модели, типа документ или изображение. Одна особенность которая представляет практический интерес, это возможность встраиваться в Web интерфейс и распознавать изображения использую встроенный механизм распознавания изображений.
Объект MODI доступен из средств разработки, через программный интерфейс модели COM. Элементы управления MODI доступны через средства разработки которые поддерживают интерфейс ActiveX и использование таких элементов управления. Программный модуль реализующий такой функционал должен быть добавлен в проект, он называется, Microsoft Office Document Imaging Viewer Control 11.0 или 12.0 (MDIVWCTL.DLL). Эти папки обычно находятся в %programfiles%\Common Files\Microsoft Shared\MODI.
MODI стал доступен в MS Office 2003, в то время как связанные программы стали доступны в MS Office XP, объектная модель движка не предоставляет элементов управления, только элемент просмотра.
Пример использования на Visual Basic .NET:
Dim inputFile As String = "C:\test\multipage.tif" Dim strRecText As String = "" Dim Doc1 As MODI.Document Doc1 = New MODI.Document Doc1.Create(inputFile) Doc1.OCR() ' распознавание всех страниц, если файл многостраничный Doc1.Save() ' сохранение переориентированное изображение в оригинальный файл и текст туда же, обратно во входной файл For imageCounter As Integer = 0 To (Doc1.Images.Count - 1) ' срабатывает на кождой странице strRecText &= Doc1.Images(imageCounter).Layout.Text ' помещение результатов работы в строку Next File.AppendAllText("C:\test\testmodi.txt", strRecText) ' сохранение распознанного файла на диск Doc1.Close() ' очистка Doc1 = Nothing
Изменения с Office 2003 SP3
В Office 2003 Service Pack 3, Microsoft исключила ассоциации с файлами типа .TIF and .TIFF с приложением Microsoft Office Document Imaging, как часть пакета исправления проблем безопасности. Также, TIFF файлы более не используют JPEG сжатие.[3]. Никаких объяснений на этот счёт дано не было.
В Office 2010 MODI полностью отвергнут. Это изменение также затронуло дерево установки, которое не показывает пункт MODI Help, OCR. Internet Fax feature в Office 2010 используют Windows Fax драйвер принтера для генерации изображений формата TIF. MODI и все его компоненты убраны в версии офиса для 64-bit Office 2010.[4]
Альтернатива MODI для Office 2010
Если MODI всё же нужен в Office 2010, вот несколько советов (среди прочих):
- Следуя рекомендациям Microsoft, установите MODI из Office 2007, выбрав в установщике только его. (Этот процесс инсталляции работает и с более ранними версиями Office): http://support.microsoft.com/kb/982760
- Установите Alterna-TIFF viewer: ActiveX элемент для IE или плагин для браузера (для других браузеров): http://www.alternatiff.com/
- Установите Black Ice’s TIFF Viewer и плагин: http://www.blackice.com/TIFFViewer.htm
- Установите Cartesian Product’s CPC viewer: CPC View ax (ActiveX для IE) или CPC Lite pi (плагин для других браузеров): http://www.cartesianinc.com/Products/CPCLite/
Примечания
- ↑ TIFF Revision 6.0 Final — June 3, 1992, Adobe Developers Association
- ↑ Handling Microsoft Office Document Scanning TNEF and TIFFs in Linux
- ↑ You may experience issues when you run the Microsoft Office Document Imaging program after you install Office 2003 Service Pack 3
- ↑ Changes in Word 2010 (for ITPros)
Ссылки
- Office — Document Imaging Microsoft online help for MODI users.
- You may experience issues when you run the Microsoft Office Document Imaging program after you install Office 2003 Service Pack 3 — Information on the changes caused by Office 2003 Service Pack 3
- [1] — Information on how to install Microsoft Office Document Imaging in Office 2007, as it is not installed automatically.
- Office 2003: Microsoft Office Document Imaging Visual Basic Reference (MODI)
- Using the Microsoft Office Document Imaging 2003 Object Model — Microsoft reference for programmers.
Microsoft Office Клиентские приложения Accounting · Access · Lync · Entourage · Excel · Groove · InfoPath · InterConnect · MapPoint · OneNote · Outlook · PowerPoint · Project · Publisher · SharePoint Designer · Visio · Word Серверные приложения Communications · Forms · Groove · PerformancePoint · Project · Project Portfolio · SharePoint Устаревшие приложения Binder · Data Analyzer · FrontPage · Liquid Motion · Mail · Office Assistants · PhotoDraw · Photo Editor · Schedule+ · Vizact · Web Components Онлайн-службы Office Online · Office 365 · Office Live Meeting · SkyDrive Версии для Windows 3.0 · 4.0 · 4.3 · 95 · 97 · 2000 · XP · 2003 · 2007 · 2010 · 2013 Версии для Mac OS 98 · 2001 · X · 2004 · 2008 · 2011 Технологии Object Linking and Embedding · Office Open XML · Visual Studio Tools for Office · Visual Basic for Applications Категория Программное обеспечение для оптического распознавания символов Свободное Графические интерфейсы Проприетарное Cognitive Forms • Expervision • FineReader • Microsoft Office Document Imaging • OmniPage • Readiris • ReadSoft • SimpleOCR • SmartScore • ViewWise
Категории:- Microsoft Office
- Discontinued Microsoft software
- Optical character recognition
Wikimedia Foundation. 2010.