ISO-2022-JPのページが自動認識で文字化けする

前回の日記 で、Firefox 3の文字コード認識の性能が上がりそうだという話をしましたが、
そのパッチで未解決な問題として bug 6362 があります。
これは要約すると、HTML、HTTPヘッダ共に文字コードが指定されていない場合、
ISO-2022-JPで書かれたドキュメントが文字化けする(文字コードの自動認識に失敗する)というものです。
ただし多くの場合、日本ではHTMLはShift-JISで書かれたものが多いと思われるので、実害はなさそうですが。

とはいえ、文字コードを自動認識に任せるのではなく、HTMLにはヘッダ部分で文字コードを指定するのが推奨されます。
例:<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

広告
カテゴリー: もじら パーマリンク

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中