ASCII码,全称美国信息交换标准代码,是一种使用7或8位二进制数进行编码的方案,总共可以表示256个字符,包括字母、数字、标点符号、控制字符及其他符号。自1968年提出以来,ASCII码因其简单性和通用性,在小型机及个人计算机中得到了广泛应用,成为数据传输标准化的重要基础。
ASCII码由两个集合组成:标准ASCII码集合,包含128个字符;扩充ASCII码集合,同样包含128个字符。每个字符通过其对应的二进制数进行表示,从而实现了字符间的标准化传输。
中国汉字的编码方案也经历了发展过程,其中最广泛使用的是GB2312-80标准。此标准规定了6763个常用汉字的二进制编码,每个汉字由2个字节表示。
GB2312-80标准将编码表分为94个区,每个区包含94个位。区号和位号通过加32(即0x20)来表示汉字的二进制编码。其中,01-09区代表符号和数字,16-87区代表汉字,而10-15区、88-94区则预留用于未来标准化。
GB2312-80将汉字分为两组:第一组包含3755个常用汉字,按照汉语拼音或笔画顺序排列;第二组包含3008个次常用汉字,按照部首或笔画顺序排列。这种编码方式使得GB2312-80能够表示最多6763个汉字,满足了当时中文信息处理的需求。