unicode编码对照表,unicode编码表查询


unicode编码对照表,unicode编码表查询

文章插图
unicode编码是什么?:
unicode编码对照表,unicode编码表查询

文章插图
Unicode是一种字符编码方案,它为每种语言中的每个字符都设定了统一唯一的二进制编码,以实现跨语言、跨平台进行文本转换、处理的要求 。
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案 。目前的Unicode字符分为17组编排,0x0000至0x10FFFF,每组称为平面,而每平面拥有65536个码位,共1114112个 。
主要内容
为了使Unicode与已存在和广泛使用的旧有编码互相兼容,尤其是差不多所有电脑系统都支援的基本拉丁字母部分,所以Unicode的首256字符仍旧保留给ISO8859-1所定义的字符,使既有的西欧语系文字的转换不需特别考量 。
另方面因相同的原因,Unicode把大量相同的字符重复编到不同的字符码中去,使得旧有纷杂的编码方式得以和Unicode编码间互相直接转换,而不会遗失任何资讯 。
举例来说,全角格式区段包含了主要的拉丁字母的全角格式,在中文、日文、以及韩文字形当中,这些字符以全角的方式来呈现,而不以常见的半角形式显示,这对竖排文字和等宽排列文字有重要作用 。
Unicode是什么???:
unicode编码对照表,unicode编码表查询

文章插图
Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案等 。
Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求 。1990年开始研发,1994年正式公布 。
Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以 。
因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的 。
Unicode 是为了解决传统的字符编码方案的局限而产生的,例如ISO 8859所定义的字符虽然在不同的国家中广泛地使用,可是在不同国家间却经常出现不兼容的情况 。
很多传统的编码方式都有一个共同的问题,即容许电脑处理双语环境,但却无法同时支持多语言环境 。
扩展资料:
Unicode 兼容于 ASCII 字符并被大多数程序所支持,前128个 Unicode 码同 ASCII 码具有同样的字节值;Unicode 字符从 U+0020 到 U+007E 等同与 ASCII 码的 0x20 到 0x7E,不同于支持拉丁字母的7位 ASCII 。
Unicode 对每个字符进行16位值的编码设置,它允许几万个字符,例如 Unicode 2.0 版包含 38,885 个字符,它也可以进行扩展,如UTF-16允许用16位字符组合为一百万或更多的字符,UTF 将编码转换为真实的二进制位 。
Unicode 完全兼容于国际标准 ISO/IEC 10646-1; 1993,它是 ISO 10646 的一个子集,并支持用两个八进制数的 ISO UCS-2 。
JavaScript 1.3 版本对 Unicode 的支持意味着您可以任意地在程序中使用本地的字符以及特殊的科学符号 。Unicode 提供了一种标准的方法来编码多语言文本,并且因为它兼容于 ASCII,您也可以随意使用 ASCII 字符 。
参考资料来源:百度百科-Unicode
unicode编码是什么意思:
unicode编码对照表,unicode编码表查询

文章插图

到底什么是unicode 编码?:
unicode编码对照表,unicode编码表查询

文章插图
这些东西没用过,或者他们根本就不是unicode-16,而是UTF-8
unicode很容易和ASCII兼容,ASCII前面加1个等于0的字节就是unicode字符了 。
unicode并没有全部汉字都收录,而且是中文日文韩文中某些字是差不多的 。
最后中文日文韩文加起来就1万多字符 。
所以2字节就几乎收录了世界上大部分的常用文字和符号 。
他还可以扩充到32字节,用以表示更多字符 。
第一个字节用特殊值作标记位,他告诉解析器,这个字节和后面三个应该当成一个字符处理 。这样他就可以表示160多万字符 。
Unicode字符列表的Unicode 编码表:
unicode编码对照表,unicode编码表查询

文章插图
【unicode编码对照表,unicode编码表查询】Unicode 编码表 BMP SMP SIP SSP 0000—0FFF 8000—8FFF 10000—10FFF 20000—20FFF 28000—28FFF E0000—E0FFF 1000—1FFF 9000—9FFF 21000—21FFF 29000—29FFF 2000—2FFF A000—AFFF 12000—12FFF 22000—22FFF 2A000—2AFFF 3000—3FFF B000—BFFF 23000—23FFF 4000—4FFF C000—CFFF 24000—24FFF 2F000—2FFFF 5000—5FFF D000—DFFF 1D000—1DFFF 25000—25FFF 6000—6FFF E000—EFFF 26000—26FFF 7000—7FFF F000—FFFF 1F000—1FFFF 27000—27FFF

推荐阅读