なんで文字化けするの?

今日もプログラミングを頑張っていこう!

ブラウザでHTMLチェック・・・

うあぁぁ!?

バグったでござるぅぅぅ

落ち着いてお侍さん!!

それはただの文字化けです。

文字化け・・・

妖怪の仕業でござるね!

違います!

今回は文字化けについてざくっと解説しますので、落ち着いてください!

①文字化けとは

「文字化け」とは、この画像のように読み取れず、どのような言語でもなさそうな文字の羅列になる現象です。

全くもってホラーでござるな!

原因はデータを読み取るときに、間違った文字コードで読み込むとこのような現象がおきます。

うむ?文字コードって何でござるか?

②文字コードとは

文字コードとは、いろんな言語(英語、日本語、アラビア語など)を機械で表現するためにあります。

以前も、こちらの記事でお伝えしたとおり、機械は「0」と「1」しか認識できません。

なんか、その話聞いた気がするでござる。

それで、機械に言語を置き換えるために、文字コード(JIS,EUC,UTF等)というものがあります。

日本語の文字も以下のように16進数の値に置き換えて、機械が認識しています。

日本語の文字JISEUCUTF-16
2422A4A23042
2459A4D93079
2537A5B730B7
※なお、他にもたくさんの文字コードがあります

日本語の「あ」はJISという文字コードでは「2422」になるでざるか。

なるほどー。人間が使う言葉と機械の言葉を変換してくれるでござるなぁ。

③どうして文字化けが発生するのか

では、なぜ文字化けが起きるかというと、データを読み取るときに文字コードが違うからです。

例えば「あ」の場合JISコードでは「2422」ですが、UTF-16では「3042」です。ということは、文字コードの変換を間違えると全く違う文字として表示されるのです。

このように、違う文字コードでファイルを開くと、バグったような表示になります。

私は子供の頃、ウイルス感染したと思い込み、心臓バクバクでした。

確かに、パソコン初心者には怖いでござる。

このため、データが壊れたり、バグったりしているわけではないので安心してください。

また、このような場合は対応する文字コードを読めるソフトウェアを使ってください。ググると大体代わりになるソフトはすぐに見つかります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA