2015年3月26日木曜日

OCR soft

PDFとかjpgとかでイメージを取り込んで後でwordとかexcelに落としたい、って需要は大きいと思います。 過去にいろいろ試してみましたが、どうも読み取り誤差が大きかったり、フォーマット無視で「後が大変」状態なので殆ど使う事はありません。
勿論常に良いものを探しているのですが、最近ソースネクストからのメールで ABBYY FineReader 12 プロフェッショナル版」の期間限定値引きが入っていたので、「どうせ、大したことは、、」と思いつつ、価格もお遊びレベルなので購入(ネットのダウンロード)してみました。 
で試しに、KWM2のアクセサリのマニュアル(DX engeneering 製、jpeg)を入れてみました。 「お!使えるジャーン」です。 
 左のJpgのイメージ(多分WEBからダウンロードしたもの)をそのままFineReaderに食わせて下のWord文書にしています。 Wordフォーマットをここにはアップできないのでwordファイル表示のスクリーン表示のpngです。 左下のタイプされた文書の処はちゃんと一文字づつ変換されていて、ワード上で内容が弄れるようになりました。 素晴らしい!! 残りの部分は夫々のブロックでイメージになっていました。 右上一番下のDX Engineeringの社名と住所の処が一塊のイメージ。

今までの物は、取り込むとフォーマットが滅茶苦茶になったりするので、使い勝手が悪く、また後で修正しようにも、オリジナルの位置が判り難くて大変でしたが、これだと問題なく使えそうです。 

後は罫線で囲まれた数字の表がちゃんとExcelに取り込めるか?
 手元に適当なものが無いので、後で探して実験してみることにしますが、今の処、「まー、どーせ」と思って買ったにしては大満足!!

0 件のコメント:

PCをWindows11にアップグレード(ハードもRyzen9 9900x+4070TiSに)

remBG(背景を消すPysonのユーティリティ)を弄っていたら、記事に書かれているのと比べてやたらスピードが遅いので、購入履歴を調べてみると、3~4年経ってしまっている。  ここは、奮起して、Ryzen9 9900x+Asus Prime X870-P WIFI-CSM +As...