« OCRを試す~ソフト・読取革命 | トップページ | OCRを試す~修正 »

2013年11月25日 (月)

OCRを試す~ソフト・e.Typist

 「読取革命」はLiteを持っているとバージョンアップ版が買え、Amazonなどでは4,900円未満です。しかしルビを無視されるのでは今回の作業には使えません。Justシステムの「一発!OCR Pro7」は「読取革命」のOEMです。体験版を両方DLすれば合計20日体験できます。

 サイトの過去記事で、かつては「読んdeココ!」のほうが読取革命13より精度が高い、ルビが読めると書いてあるのを見ましたが、昨年で開発・販売中止。エー・アイ・ソフトはメガソフトとラインナップを競っていた会社で、「まっぷっぷ」はDOSのころから愛用してました。

 だいたいPCソフトが儲かるビジネスではなくなったのでしょう。電気店でソフトの棚は縮小しっぱなしです。スマホとタブレット(非PC)にシェアを奪われれば、Windowsさえ危うくなるかもしれません。

 さて次に目を付けたのが「e.Typist」です。記憶に残っていたので引出しをあさったら、2代前のスキャナCDに「e.Typistエントリー」がバンドルされていました。これがあれば最新バージョンアップ15ダウンロード版を4,300円で入手できる模様です。

 そこでこのソフトも5日間の体験版を試すことにしました。

 ルビは「削除・文書中に入れる・そのまま(漢字の横)」が選べます。まずルビ削除で「文七」の同じページを

文七元結
(ぶんしちもっとい)
昔からよく申しますが、三道楽煩悩なんという、酒に博
に遊びという、これァま、みな男の道楽としてございますが……昔は名人気質なんてえことを言いまして、お職人やなにかでも、あの人は腕がいいなというと、必ずこの、癖がありまして、勝負ごとが好きとか、酒が好きとか女道楽をする、なんかしら道楽があるもんで、それがために、せっかくの腕を持ちながら貧乏して、きゅきゅしてえるてえのがあったもんで……。子供が親に苦労をかけるという、これ、あたりまえでございますが、には親が子に苦労をかけるなんという、始末の悪いのがありまして、
「おい、どうしたんだ、おい、まだ燈火をつけねえのか……なんだ、其処にいるんじゃねえか、なにをしてるんだ、おい」
「なにをしてンだじゃないよ(
嬬衿の袖を眼にあてて、すッとひとつ鼻をすすり)またおまえ…なんだね、細川の部屋で負られて来たんだね?」
「ッてやンで
、兄、負られようてんで取られに行くやつァねえや、もうけるつもりで行ったのが負

 どうでしょう。誤認識はどっちもどっちかも。小書き文字はまあまあ。”ン”は正しく認識しました。でも他のページでは「e.Typist」が惨敗のものがありました。

 肝心のルビも認識させました。「そのまま」はワードに送るのなら使えますが、テキストファイルで保存するには「文書中に入れる」ことになります。デフォルトではルビを()で囲みます。それだと本来の()と区別がつかなくなるので、青空文庫のテキスト形式にならって《》で囲むように設定しました。

文七元結
(ぶんしちもっとい)
昔からよく申しますが、三道楽煩悩《さんどら
んのう》なんという、酒に博《ばくち》に遊《あす》びという、これァま、みな男の道楽としてございますが……昔は名人気質《かたぎ》なんてえことを言いまして、お職人やなにかでも、あの人は腕がいいなというと、必ずこの、癖《へ》がありまして、勝負ごとが好きとか、酒が好きとか女道楽をする、なんかしら道楽があるもんで、それがために、せっかくの腕を持ちながら貧乏して、きゅきゅしてえるてえのがあったもんで……。子供が親に苦労をかけるという、これ、あたりまえでございますが、には親が子に苦労をかけるなんという、始末の悪いのがありまして、
「おい、どうしたんだ、おい、まだ燈火《あかり》をつけねえのか……なんだ、其処《そこ》にいるんじゃねえか、なにをしてるんだ、おい」
「なにをしてンだじゃないよ
(嬬衿の袖を眼にあてて、すッとひとつ鼻をすすり)またおまえ…なんだね、細川の部屋で負《と》られて来たんだね?」
「ッてやンで
、兄、負《と》られようてんで取られに行くやつァねえや、もうけるつもりで行ったのが負《と》

 ルビはカナだけとはいえ、小さいのでノイズには弱いですね。またルビの中の小書き文字は並み文字と同じ大きさで印刷されているので、判別はできなくても当然です。

Etypist

|

« OCRを試す~ソフト・読取革命 | トップページ | OCRを試す~修正 »

コメント

誤認識の割合は、どのソフトでもそれほど変わらないようですね。文字の大小の判別が苦手なのも昔から相変わらずです。

投稿: はろー | 2013年11月25日 (月) 23時18分

 読んdeココ!の開発が終了した以上、ルビを求めるなら、e.Typistしか選択肢がないようですね。

 たぶん認識率はもっと向上すると思うんですよ。顔認識では人間が間違う双子を見分け、指紋や網膜などは人間が分析できないパターンを見つけるのですから、文字認識は人間以上になるはずです。開発にはニーズが必要になりますが。

 富士通SV600みたいなマシンが普及すればテキスト化の潜在的欲求を掘り起こせるのかもしれません。

投稿: snob | 2013年11月25日 (月) 23時51分

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: OCRを試す~ソフト・e.Typist:

« OCRを試す~ソフト・読取革命 | トップページ | OCRを試す~修正 »