実験レポート『一発!OCR Pro3 for 一太郎』とPIXUS MP790で、複数原稿を一気にOCR処理してみよう! 実験レポート『一発!OCR Pro3 for 一太郎』とPIXUS MP790で、複数原稿を一気にOCR処理してみよう! 実験レポート『一発!OCR Pro3 for 一太郎』とPIXUS MP790で、複数原稿を一気にOCR処理してみよう!
新製品説明会や学会で配布される資料、あるいは企画書、仕様書など。紙の出力や印刷物は、予想以上に多いのが現実。これらを一太郎形式のファイルやテキストデータでもらえれば、管理も活用も楽なのに…。そう思ったことはありませんか?
仮説2へ
 
仮説1 ADF(自動原稿送り装置)を装備した複合機を利用すれば解決!
そこで思いついたのが、複合機を利用する方法。ADF(自動原稿送り装置)を装備したPIXUS MP790と『一発!OCR Pro3 for 一太郎』を使えば、複数枚の原稿を一気にOCR処理することができるのではないか、というわけです。
では、さっそく実験してみましょう!

※PIXUS MP790で扱うことができる原稿サイズはA4以下となります。
実験1 複数枚分の原稿をひとつの一太郎ファイルに!
複数枚の原稿をADFで一気に読み込んでOCR処理し、ひとつのファイルにしてみましょう。
手順
1.  原稿をPIXUS MP790のADFにセットします。
ADFに原稿をセット
2.  『一発!OCR Pro3 for 一太郎』を起動します。
『一発!OCR Pro3 for 一太郎』を起動
『一発!OCR Pro3 for 一太郎』が一太郎のアドインに設定されている場合は、お使いの一太郎画面からボタンひとつで起動することができます。これは便利!
一太郎画面からボタンひとつで起動
3.  「入門ウイザード」をクリックするとウイザード画面が表示されるので、ステップごとに内容を設定します。
ウィザードボタン ステップ1〜3
認識後のファイル形式は、ステップ4で選択できます。今回は一太郎形式を選択しました。すべての設定が終わったら、「認識実行」ボタンをクリック。
認識実行
4.  TWAINデバイス入力「ADF読込」のチェックボックスをチェックして、「スキャン」ボタンをクリックすると、ADFにセットされた原稿が次々に読み込まれていきます。
「ADF読込」をチェック
5.  読み込まれた原稿が、まとめてOCR処理されていきます。この後、ひとつの一太郎ファイルとして一太郎画面に転送されます。
原稿を認識中
6.  保存されたデータが一太郎画面上に表示されました。あとは、認識ミスされている部分を修正して保存すればOK!
読み込まれたデータが一太郎画面に
結果 -成功!-
結果は大成功!
ADF付きのPIXUS MP790なら、スキャン→認識後に保存→次の原稿にセットし直してスキャン…という煩わしさは、もう必要ありません。

今回セットした原稿は10ページ。最初は、1ページ分ずつ計10個の一太郎ファイルができると思っていました。そう、普通のフラットベッドスキャナを使った場合と同じように。
しかし、実際には10ページ分の原稿がひとつの一太郎ファイルになってくれたのです! これなら、後からファイルを連結させる手間も不要ですね。
ADFを使って一気にOCR処理をするメリットは、予想以上に大きいといえそうです。
10ページ分の原稿がひとつの一太郎ファイルに!
ワンポイント
ページ物はコピーしてからスキャン!
ページ物はコピーしてしまえばOK!
コピーの品質も申し分なし!
コピー機能は、パソコンが起動していなくても利用できます。
複数枚の原稿をまとめてOCR処理できるのは、確かに便利です。けれど、雑誌やカタログなど、原稿が綴じられている場合にも対応してくれればもっと助かるのに…。PIXUS MP790は、そんなニーズにも応えてくれるのです。

PIXUS MP790は、プリンタ、スキャナ、コピー、FAXの4つの機能を持つ複合機。そこで提案したいのが、あらかじめ必要なページをコピーしてしまう方法です。あとは、コピーした原稿を一気に読み込んでOCR処理すればOK。こんなことができるのも、ADF付き複合機のPIXUS MP790と『一発!OCR Pro3 for 一太郎』の組み合わせならでは、ですね!
仮説2 「フォルダーウォッチャー」でOCR処理を自動化
『一発!OCR Pro3 for 一太郎』には、「指定フォルダを常に監視し、そこに保存された文書画像を自動的にOCR処理してファイル化する」という便利な機能があります。これを使えば、一般的なフラットベッドスキャナベースでのOCRでも、作業効率が格段に向上するはず。
カタログや雑誌はもちろん、分厚い本でも、どんどん画像化して指定フォルダに放り込めば、OCR処理はすべてパソコンまかせにできるのでは?

では、さっそく実験してみましょう!
仮説1へ
実験2 指定フォルダに保存した文書画像を自動的に一太郎ファイルへ変換!
『一発!OCR Pro3 for 一太郎』の機能、「フォルダーウォッチャー」を実際に試してみましょう!
手順
1.  『一発!OCR Pro3 for 一太郎』の「フォルダーウォッチャー」を起動します。
『フォルダーウォッチャー』を起動
2.  環境設定画面で、監視先のフォルダや出力先フォルダ、出力するファイルの形式などを設定します。ここでは、一太郎形式を選択します。
環境設定画面
3.  「監視する」ボタンをクリックして、フォルダの監視をスタート!
任意フォルダの監視を開始
4.  別途スキャンした文書画像を監視フォルダに保存してみます。すると、自動的にOCR処理され、指定したファイル形式に変換されました! これは便利!
監視フォルダ保存されたに文書画像(jpgファイル)が自動的に一太郎ファイル化!
※このケースでは、監視先と出力先が同一のフォルダに設定されています。また、OCR処理された文書画像は削除される設定にしています。
結果 -成功!-
この実験も大成功!
フォルダーウォッチャーを使えば、指定したフォルダに文書画像を次々に放り込むだけで、一太郎やテキストファイルに変換することが可能になります。このフォルダをネットワークで共有すれば、さらに使い勝手がよくなりそう! 社内の文書管理・共有に大きく貢献してくれることうけあいです。
 
フォルダーウォッチャーは、『一発!OCR Pro3 for 一太郎』の機能なので、フラットベッドスキャナと組み合わせても利用できます。が、どちらかといえば、やはりPIXUS MP790がオススメ。ADFを使って複数の原稿を一度にスキャンすることができるので、さらに効率よく文書を画像化することができました。

なお、文書を画像化するには、PIXUS MP790付属のユーティリティソフトを使用しています。

一発!OCR Pro3 for 一太郎

実験環境:
OS:Windows XP Home Edition Service Pack 2
CPU:Pentium® 4 2.53GHz
RAM:512MB