2015年3月26日木曜日

OCR soft

PDFとかjpgとかでイメージを取り込んで後でwordとかexcelに落としたい、って需要は大きいと思います。 過去にいろいろ試してみましたが、どうも読み取り誤差が大きかったり、フォーマット無視で「後が大変」状態なので殆ど使う事はありません。
勿論常に良いものを探しているのですが、最近ソースネクストからのメールで ABBYY FineReader 12 プロフェッショナル版」の期間限定値引きが入っていたので、「どうせ、大したことは、、」と思いつつ、価格もお遊びレベルなので購入(ネットのダウンロード)してみました。 
で試しに、KWM2のアクセサリのマニュアル(DX engeneering 製、jpeg)を入れてみました。 「お!使えるジャーン」です。 
 左のJpgのイメージ(多分WEBからダウンロードしたもの)をそのままFineReaderに食わせて下のWord文書にしています。 Wordフォーマットをここにはアップできないのでwordファイル表示のスクリーン表示のpngです。 左下のタイプされた文書の処はちゃんと一文字づつ変換されていて、ワード上で内容が弄れるようになりました。 素晴らしい!! 残りの部分は夫々のブロックでイメージになっていました。 右上一番下のDX Engineeringの社名と住所の処が一塊のイメージ。

今までの物は、取り込むとフォーマットが滅茶苦茶になったりするので、使い勝手が悪く、また後で修正しようにも、オリジナルの位置が判り難くて大変でしたが、これだと問題なく使えそうです。 

後は罫線で囲まれた数字の表がちゃんとExcelに取り込めるか?
 手元に適当なものが無いので、後で探して実験してみることにしますが、今の処、「まー、どーせ」と思って買ったにしては大満足!!

0 件のコメント:

php のインストールの確認

phpって最初のfacebook書くときに使われたみたいで、それなりに歴史のある言語で、私も2006年位から使っていますが、CLIで使う事はあまり無いので、apacheとの連携のトラブル(mod_phpのバージョンの齟齬)などは気になりますが、拡張モジュールのインストールの問題に...