なんで文字化けするの?
今日もプログラミングを頑張っていこう!
ブラウザでHTMLチェック・・・

うあぁぁ!?
バグったでござるぅぅぅ
落ち着いてお侍さん!!
それはただの文字化けです。
文字化け・・・
妖怪の仕業でござるね!
違います!
今回は文字化けについてざくっと解説しますので、落ち着いてください!
①文字化けとは
「文字化け」とは、この画像のように読み取れず、どのような言語でもなさそうな文字の羅列になる現象です。

全くもってホラーでござるな!
原因はデータを読み取るときに、間違った文字コードで読み込むとこのような現象がおきます。
うむ?文字コードって何でござるか?
②文字コードとは
文字コードとは、いろんな言語(英語、日本語、アラビア語など)を機械で表現するためにあります。
以前も、こちらの記事でお伝えしたとおり、機械は「0」と「1」しか認識できません。
なんか、その話聞いた気がするでござる。
それで、機械に言語を置き換えるために、文字コード(JIS,EUC,UTF等)というものがあります。
日本語の文字も以下のように16進数の値に置き換えて、機械が認識しています。
日本語の文字 | JIS | EUC | UTF-16 |
---|---|---|---|
あ | 2422 | A4A2 | 3042 |
べ | 2459 | A4D9 | 3079 |
シ | 2537 | A5B7 | 30B7 |
日本語の「あ」はJISという文字コードでは「2422」になるでざるか。
なるほどー。人間が使う言葉と機械の言葉を変換してくれるでござるなぁ。
③どうして文字化けが発生するのか
では、なぜ文字化けが起きるかというと、データを読み取るときに文字コードが違うからです。

例えば「あ」の場合JISコードでは「2422」ですが、UTF-16では「3042」です。ということは、文字コードの変換を間違えると全く違う文字として表示されるのです。
このように、違う文字コードでファイルを開くと、バグったような表示になります。
私は子供の頃、ウイルス感染したと思い込み、心臓バクバクでした。
確かに、パソコン初心者には怖いでござる。
このため、データが壊れたり、バグったりしているわけではないので安心してください。
また、このような場合は対応する文字コードを読めるソフトウェアを使ってください。ググると大体代わりになるソフトはすぐに見つかります。