MeTilTranの使い方

6インチのStoryHDを使えているのは、MeTilTranのおかげです。
いろいろ試行錯誤してMeTilTranの使い方がわかってきたのでA5版縦書きの本を6インチのリーダーで読めるようになりました。

全体的な手順

自炊データPDF→PNG形式で各ページを書き出し
→まず一度MeTilTranにかけてみる
→ノンブルや章名など、本文外エリアをちゃんと「ノンブル」「無効」などと認識してくれたら、そのままMeTilTranで作業
→本文外エリアの誤認識が多かったら、PDFDietで本文外エリアをカット(余白圧縮をオフにして、なるべく余白を残した状態でPNG出力)してからMeTilTran
→ChainLPで最終的なフォーマットに出力

ポイント1:なるべくPNG

JPGノイズが誤認識の元になるので、なるべくPNG形式(24bit)で作業をします。これだけで随分作業効率が上がりました。

ポイント2:ノンブルを誤認識する場合はPDFDietで事前に本文以外を削除

PDFからPNG形式で画像出力して、MeTilTranに読み込ませます。このとき、ノンブルや章タイトルなど、本文以外のエリアをMeTilTranがうまく認識してくれるなら問題ありません。
ノンブルを認識してくれない、ページ上下に入った横書きの章タイトル部分も本文エリアと誤認識する、など困ったことになったら、PDFDietを使って本文外エリアをカットします。(全部のページのノンブルを完璧にカットできなくても大丈夫。大幅に手間が減らせます。)このとき余白圧縮のチェックを外すのがポイント。余白が少ないとMeTilTranでの処理で本文の上下が切れがちなので、余白をなるべく残すようにします。出力サイズ指定のチェックも外し、元データに近いサイズのまま出力します。出力形式はPNGで。

ポイント3:目次は挿絵に

目次は縦書きと認識されても、ページ編集モードで挿絵ページとして設定した方が出力結果が良いです。

ポイント4:誤認識するページは補正角を変えて再認識してみる

本文エリアはちゃんと認識しているけれど行の認識が変なときには、ページ編集モードで補正角を少し(+-0.2くらい)変えて再認識させるとうまく行くときがあります。

ポイント5:本文エリアを誤認識するページがあったら、グループ編集モードで修正

箇条書きを段組と誤認識するなど、本文エリアの認識ミスがあればグループ編集モードでグループを削除したり大きさを変更したりして直します。

ポイント6:2行に分割されてしまう行は、行編集モードで隣接行融合+偽ルビ分離

ルビでもないのに行+ルビと解析された行は「偽ルビ融合」。

ポイント7:「プロジェクトの保存」を忘れない

「プロジェクトの保存」をしなくても再配置できますが、プロジェクトファイル(relocation.txt)があるとやり直したり別の解像度に出力し直したりすることが楽にできます。

ポイント8:修正が終わったら「ツール」-「再配置プレビュー」-「ウィザード」

文字サイズと「字数」「行数」を増減させて、好みの配置になるように調整します。(文字サイズは25,50,75,100%から選ぶようになっていますが、手入力もできます。100%を超えた値にも設定できます。自分の場合は120〜140%にしていることが多いです。)文字サイズは覚えておいて、最後に再配置する際に入力します。