見落としてた・・・

>ひらがなとかはわりとデコードできるんですけど・

デコードできる== 正しい文字で認識出来るってことだよね?
html含め処理内の文字コードの統一は出来てる??