文字コード#
前提知識:#
- コンピュータが文字を扱うためには、2進数に解釈できる
バイト列に変換する必要がある。 - 符号化文字集合(「文字」と「文字に割り当てた番号」の対応表のこと)のコードポイントをコンピュータが扱えるようデータ列(通常、バイト列)へ変換する方式を
文字符号化方式と呼ぶ。 - この変換を
エンコードという - 反対にバイト列から人が読む文字列への変換を
デコードという - 例として文字符号化方式の代表的なものには、
UTF-8、ASCII、EUC-JP、Shift_JISがある。