namazuでのindex作成もpdftotextでの変換もできなかった
PDF-1.4のファイルがありまして、
なんとかしてやろうとエディタで開いたら、
文字化けだらけだったのね。
んで、文字化けなら、文字コード変えればなんとかなるかと思って、
$nkf --euc hoge.pdf |lv
してみたのさ。そしたら、以下。

ウク ー
シシ
ッミモ ロ ッミトニ ッヤ ッノツ ン

とか、

オオカ オーー オーー オオカ エエエ ウクケ オオカ オオカ イイイ エエエ オーー ウ
クケ キキク

とか、わけわからん土人語に翻訳されちゃったのだ。
おいらはどうすればよいでしょう。
つーか、PDFの謎の文字化け、本来どの文字コードで書かれてたんでしょう。
スレちがいっぽいけど。