« 「のんびりする」をする | トップページ | 段ボール、ガンダム »

2004.12.08

原書導入

 1冊ぶんの原書をPCにくわせるのに、やっぱり1日(正確には6時間くらい?)かかる。ふだんは休みの日に、一度に1~2時間ずつやるんで、なかなか実感がわかないけど。

 まず、コピーをとって、版面がまっすぐになるように切り、スキャナにかけて、OCRかけるまで。コピーをとるのは、原書がいちばん悪い中質紙(藁半紙ね)で、版面もぐちゃぐちゃなので、そのままOCRにかけると認識率が大幅に落ちるから。もうひとつ、作業中に原書をひろげておくと、コーヒーをこぼしたりというアクシデントが考えられるので、コピーを使ったほうが安心っていう理由もある。カッティングも同じ理由。ここまでで2時間。

 スキャナで読みこむのは、1時間半くらいかな。前段階でちゃんと加工してあるから、ここは速くすむ。いまのスキャナだと、1回ずつ調光するため、すごく時間がかかるから、この作業専用に、古いシャープのJX-250という機種を使っている。ちなみに、原書本文は55ページ前後なので、前後編あわせて約110ページ。

 OCRはいちばん手間がかかる。雑誌形式なので、領域を自動認識させるとごみがはいるから、手作業になっちゃうのだ。そのかわり、さいわいOCRソフトが非常に優秀で、誤認識はほとんどないので(たぶん、認識率99.99%くらいじゃないかな? つまり、ミスは1万字に1回くらいの割合)、校正する必要はない。ま、そのためにコピーとって、カッティングしてるんだけど。

 ちなみに、OCRソフトはエー・アイ・ソフトの「Presto! OCR Pro 4.1」というやつ。ver4.1はWinXPに対応している(4.0以前は未対応)のに、同社サイトでは「動作不可」になってる。(^_^;) だから、4.0では動作しなかったから、4.1に無償バージョン・アップしたんだってば。(^^;;;

 エー・アイはこのソフト、どうやらもう売らないつもりらしい。ドイツ語が読める貴重なOCRなのにな~。(TnT)

 実際には、このあと翻訳支援ソフトにコピペする作業がのこっているが、それはまた休日にやることにしよう。次のゲラがきたぞっと。つくづく、ワーカホリックだなあ。(T^T)

|

« 「のんびりする」をする | トップページ | 段ボール、ガンダム »

コメント

この記事へのコメントは終了しました。

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/40142/2190676

この記事へのトラックバック一覧です: 原書導入:

« 「のんびりする」をする | トップページ | 段ボール、ガンダム »