情弱エンジニアのなかのblog

一人前のエンジニアになる為のブログです

文字コードについて基礎からの勉強1

最近文字コードに関して開発を行うことがあり曖昧だった部分など改めて調べました。

UTF-8Shift_JISについて

文字コードの中でも目にする機会が多い「UTF-8」と「Shift_JIS」これらの違いについて調べてみました

UTF-8

Unicode文字集合体とする

・文字範囲が広く、どの言語の文字にも対応している

・文字によって割り振られたバイト数が違い、日本語の場合3バイト

・文字化けを起こす可能性が低い

使うメリット

文字範囲が広いので、国内国外に関係なく広く利用することができる。文字化けなどが起こりにくいため、思わぬ動作が起こってしまうリスクが低い。

Shift_JIS

今までShift-JISとハイフンで書いてました、、、 Shift_JISなんですね~

JIS X 0208文字集合体とする

・日本語について文字範囲として十分である

・一文字2バイト

・環境によって文字化けが起こったりする

・日本国内の携帯で主に読めるコード

メリット

日本語を使用するならば、UTF-8と比較して容量を少なくすることができる。

デメリット

文字化けが起こる可能性がある。UTF-8と比較して文字範囲が狭いため、使用できない文字が多い。

とりあえずこんなところで、今後も調べていきたいと思います。