自炊洋書の場合
- 自炊PDFを作る
- OCRするときに、PDFの出力形式を「テキストとグラフィック」にする
- calibreに入れて.mobiに変換
これで、辞書lookupが可能になることがわかりました。
ただ、一部の文字が図版として誤認識されたり、図版がバラバラになったり、相当ストレスのたまる出来栄えです。図版が多い本や数式の入った本は完全にNGでしょう。
テキストPDFの洋書
素直にcalibreで.mobiに変換できます。
ただ、ソースコード部分のインデントがなくなったり、見づらくなります。
手軽な方法
自炊(+OCRで透明テキスト)PDFでもテキストPDFでもOKな方法です。自炊PDFのOCR出力方式は「検索可能な画像」でもOKなのがミソ。
- Acrobatで[ファイル]-[書き出し]-[HTML4.0+CSS1]でhtmファイルに保存
- kindlegen xxxx.htmで.mobiに変換
細かいことはいいから.mobi形式にしたい時には、この方法が一番手軽な気が。