本のスキャンのその後 @ val it: α → α = fun

スキャンした本を何冊かKindleで読んでみた。

これはまぁ普通に読めるレベル。ただKindleに入っているコンピュータの性能の問題か、PDFはロードに時間がかかって若干もたつきを感じる。ページ送りも遅い。e-Inkの例のアレもちょっとあまりいい気分ではない。一方、Kindleの場合、目の疲れはないし、重いという人もあるけれど僕にとっては電車の中で立って読めるぐらいで快適だ。iPadの重さではこれはさすがに無理。

グレイスケールよりは二値化したほうが文字は読みやすい。グレイスケールの方がモニタ上では美しいが、Kindle上では細い線がかすれてしまい、じゃっかん読むのに手間取る。ただ、二値化した場合、網掛けの部分とか、どうしようもなく汚くなってしまう部分がある。ライトノベルのイラストなんかは見るも無残な感じになるだろうし、そうでなくても本てのは意外とそういう飾りが随所にあるものだ。イラストを諦めて二値化するのは嫌だし、たとえば文字だけのページだけそういう処理をするよう頑張るのも嫌で、さてどうしたものだろう。このへんはiPadならば美しく表示されるんだろうな。

ところが一方、まんがはかなり読みやすい。フキダシの文字も苦にはならない。なんでかなと思ったのだが、ゴシック体が使われがちだからかもしれない。たいていのまんがのたいていの活字では、漢字がゴシック体でひらがなが明朝体なフォントが使われているが、細くなって見づらくなるのは漢字の方なので、それだけで結構読みやすくなるのかもしれない。ゴシック体は比較的線が太く、一定なので、あまりかすれない。あと、まんがの文字は大きめのものも使われるからだろうか。文字が大きいとかすれは目立たなくなり、比較的読みやすくなる。

まんがといえば見開きをどうするかはまだ決心していない。アイディアとしては、全ページを2ページずつ結合して見開きのようにして読むか(Kindleは横向きにする)、そのページだけ結合するかということになる。もっともその前に、Acrobatでどうやって結合して見開きページを作ればいいのかはよくわかってないのだが……。ただやろうと思えば、画像データを取り出してImageMagickなりなんなりで結合して、画像の集合を結合してPDFにすればいいという話はある。ただその場合、OCRはあきらめないといけないだろう。

OCRといえばスキャナドライバにもOCRの機能があり、これが1ページあたり3-5秒程度かかるとこないだ書いたが、AcrobatにもOCRの機能があり、こちらの方が若干速いようだ(1ページ当たり2-4秒ぐらい)。縦書きの文章についてもAcrobatの方が若干精度が良い、気がする。まんがでも、絵の部分に文字を「発見」してしまうようなfalse positiveが少ないようだ。ただAcrobatではOCRの時にページの角度調整を自動的にやってしまい、これが悪さをすることがある。まんがなど、ページの真ん中に斜めのコマ割りが入ってたりするとその向きに沿ってページの向きを整えてしまったりして無残な結果になりかねない。結局、こういう用途では使いものにならない。

そういうわけで、ScanSnapからKindleという道筋には、まだ考えないといけないことがいろいろあるように感じています。そもそもPDFで取り込むのがいいのかJPEGで取り込むのがいいのかもわかっていない。まだまだ試行錯誤の段階だなーと思っています、何事も。

val it: α → α = fun

本のスキャンのその後

Archives

disclaimer