文字コード#
前提知識:#
- コンピュータが文字を扱うためには、2進数に解釈できる
バイト列
に変換する必要がある。 - 符号化文字集合(「文字」と「文字に割り当てた番号」の対応表のこと)のコードポイントをコンピュータが扱えるようデータ列(通常、バイト列)へ変換する方式を
文字符号化方式
と呼ぶ。 - この変換を
エンコード
という - 反対にバイト列から人が読む文字列への変換を
デコード
という - 例として文字符号化方式の代表的なものには、
UTF-8
、ASCII
、EUC-JP
、Shift_JIS
がある。