洋書PDFをKindleで辞書lookup可能に

自炊洋書の場合

  1. 自炊PDFを作る
  2. OCRするときに、PDFの出力形式を「テキストとグラフィック」にする
  3. calibreに入れて.mobiに変換

これで、辞書lookupが可能になることがわかりました。
ただ、一部の文字が図版として誤認識されたり、図版がバラバラになったり、相当ストレスのたまる出来栄えです。図版が多い本や数式の入った本は完全にNGでしょう。

テキストPDFの洋書

素直にcalibreで.mobiに変換できます。
ただ、ソースコード部分のインデントがなくなったり、見づらくなります。

手軽な方法

自炊(+OCRで透明テキスト)PDFでもテキストPDFでもOKな方法です。自炊PDFのOCR出力方式は「検索可能な画像」でもOKなのがミソ。

  1. Acrobatで[ファイル]-[書き出し]-[HTML4.0+CSS1]でhtmファイルに保存
  2. kindlegen xxxx.htmで.mobiに変換

細かいことはいいから.mobi形式にしたい時には、この方法が一番手軽な気が。