英文字母unicode编码表,python中unicode编码表


英文字母unicode编码表,python中unicode编码表

文章插图
完整的unicode汉字编码表:
英文字母unicode编码表,python中unicode编码表

文章插图
65
怎样查一个字符的unicode编码:
英文字母unicode编码表,python中unicode编码表

文章插图
现在有很多工具可以辅助查询 。

可以通过这个工具:http://tool.oschina.net/encode
或者推荐这个网址: http://bianma.supfree.net/ Unicode
另外UNICODE官网上也提供了对照表的下载,只不过那个东西是PDF,可以搜索字的对应unicode
Unicode编码表怎么看 。U+是指的什么?前面的数字是:
英文字母unicode编码表,python中unicode编码表

文章插图
【英文字母unicode编码表,python中unicode编码表】U+指Unicode编码,数字为十六进制 。
如何从编码列表中选择一个unicode选项:
英文字母unicode编码表,python中unicode编码表

文章插图
将文本拷贝到记事本中,另存为一个Unicode格式文件即可 。
记事本【另存为】新文件时,【编码】中缺省的是“ANSI”,在下拉菜单中选定“unicode”即可 。
什么是unicode编码?:
英文字母unicode编码表,python中unicode编码表

文章插图
Unicode码扩展自ASCII字元集 。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽;而Unicode使用全16位元字元集 。这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号 。Unicode最初打算作为ASCII的补充,可能的话,最终将代替它 。考虑到ASCII是电脑中最具支配地位的标准,所以这的确是一个很高的目标 。
Unicode影响到了电脑工业的每个部分,但也许会对作业系统和程式设计语言的影响最大 。从这方面来看,我们已经上路了 。Windows NT从底层支援Unicode 。
目前计算机中用得最广泛的字符集及其编码,是由美国国家标准局(ANSI)制定的ASCII码,它已被国际标准化组织定为国际标准,称为ISO 646标准 。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式 。
Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符,比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制,2的16次方等于65536,所以UCS-2最多能编码65536个字符 。编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是没办法的,简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万 多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字 也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符

    推荐阅读