Unicode是字符集，UTF-8是编码，理解错没？ - firefox吧 - RAT

Unicode是字符集，UTF-8是编码，理解错没？

level 12

未来成功者20 楼主

以下关于编码的理解，有哪些错误的，求指出。
1.UTF-8依据unicode字符集，前128个字符用一个字节编码，第129到第2048个字符用两个字节编码，第2049到后面的用3个字节编码
2.所说的unicode编码就是UTF-16编码。不管是哪种字符，都用两个字节编码。为什么一般说unicode编码，很少说UTF-16编码？
3.UTF-8号称万国码，但最多只能编码65536个字符，而unicode字符集从很早就有七万多个字符，现在已超过十万，出现一个矛盾。UTF-8虽能编码许多国家的字符，但不是所有字符，因为不够，它能编码的字符只是unicode字符集的一个子集。
4.unicode可能是universal和code组成的合成词

2015年02月06日 13点02分 1

level 12

未来成功者20 楼主

顶

2015年02月06日 14点02分 3

level 11

微软改名部

为什么只能65536个？还有txt保存的ansi是什么意思。

2015年02月06日 15点02分 4

未来成功者20

晕，指望别人帮我，你倒问起我来了。中文字符采用UTF -8编码时用3个字节，就是24位，而根据它的特点，有8位是固定不动的，只有16位可以变化，所以是2的16次方，65536。

2015年02月06日 15点02分

未来成功者20

记事本默认ANSI编码表示用特定国家编码，每个国家有自己的编码。在中国就用GBK，在日本就用日本编码，在韩国就用韩国的编码。写的文件在韩国语言的Windows上很可能乱码，用Android记事本打开就是乱码的，不信你试试

2015年02月06日 15点02分

回复
δ��ɹ��20
:用特定国家编码保存的文件在其他国家记事本打开可能乱码，为什麼不统一用一种编码，比如utf8，这样不是就可以通用了吗，不用担心乱码的问题

2015年02月07日 08点02分

未来成功者20

@☞半生☜ 历史遗留问题

2015年02月07日 10点02分

level 12

未来成功者20 楼主

找到以前比较通俗的博文
http: [汗]

[汗]

//blog

[喷]

.csdn

[惊讶]

.net/softman11/article/details/6124345

2015年02月06日 16点02分 6

level 13

不懂这些……
我只知道实际情况是，utf-8可以支持多于65536个汉字，另外还可以支持许多符号。
在汉字领域，一直到cjk-e的字都是可以支持的。
再算上一些符号，至少已经达到8万以上的字符了。

2015年02月06日 17点02分 7

回复 _光明星_ :我没接触过十万字符……现在我接触过的最大的字符集是海峰五笔码表里的8万多个汉字加符号

2015年02月07日 08点02分

回复
_��_
:这个就是“在电视里见过”和“自己亲眼见过”的区别了……

2015年02月07日 09点02分

回复 _光明星_ :好像是到CJK-D

2015年02月07日 13点02分

@阴阳帐篷这里写了 Unicode 写了多少字符→http://babelstone.co.uk/Unicode/babelmap.html

2015年02月16日 06点02分

level 12

未来成功者20 楼主

http://www.zhihu.com/question/20650946

2015年02月07日 03点02分 10

level 12

未来成功者20 楼主

http://www.zhihu.com/question/20167122

2015年02月07日 03点02分 11

未来成功者20

这个问题后面几个回复很有意思

2015年02月07日 03点02分

level 14

永远风清扬

楼主你忘了utf-16有be和le之分。。。而且还有utf-32，也有be和le之分，不能简单的说unicode就是utf-16

2015年02月07日 10点02分 12

level 11

syslykk

好复杂

2015年02月07日 11点02分 13

level 1

[乖]

2015年02月16日 07点02分 14

level 1

UTF-8理论上最多可以支持6字节编码
UTF-16也已经升级为2字节和4字节的变长编码了

2022年12月14日 12点12分 15

1