Unicode是字符集,UTF-8是编码,理解错没?
firefox吧
全部回复
仅看楼主
level 12
以下关于编码的理解,有哪些错误的,求指出。
1.UTF-8依据unicode字符集,前128个字符用一个字节编码,第129到第2048个字符用两个字节编码,第2049到后面的用3个字节编码
2.所说的unicode编码就是UTF-16编码。不管是哪种字符,都用两个字节编码。 为什么一般说unicode编码,很少说UTF-16编码?
3.UTF-8号称万国码,但最多只能编码65536个字符,而unicode字符集从很早就有七万多个字符,现在已超过十万,出现一个矛盾。UTF-8虽能编码许多国家的字符,但不是所有字符,因为不够,它能编码的字符只是unicode字符集的一个子集。
4.unicode可能是universal和code组成的合成词
2015年02月06日 13点02分 1
level 12

2015年02月06日 14点02分 3
level 11
为什么只能65536个?还有txt保存的ansi是什么意思。
2015年02月06日 15点02分 4
晕,指望别人帮我,你倒问起我来了。中文字符采用UTF -8编码时用3个字节,就是24位,而根据它的特点,有8位是固定不动的,只有16位可以变化,所以是2的16次方,65536。
2015年02月06日 15点02分
记事本默认ANSI编码表示用特定国家编码,每个国家有自己的编码。在中国就用GBK,在日本就用日本编码,在韩国就用韩国的编码。写的文件在韩国语言的Windows上很可能乱码,用Android记事本打开就是乱码的,不信你试试
2015年02月06日 15点02分
回复
δ���ɹ���20
:用特定国家编码保存的文件在其他国家记事本打开可能乱码,为什麼不统一用一种编码,比如utf8,这样不是就可以通用了吗,不用担心乱码的问题
2015年02月07日 08点02分
@☞半生☜ 历史遗留问题
2015年02月07日 10点02分
level 12
找到以前比较通俗的博文
http:[汗]//blog[喷].csdn[惊讶].net/softman11/article/details/6124345
2015年02月06日 16点02分 6
level 13
不懂这些……
我只知道实际情况是,utf-8可以支持多于65536个汉字,另外还可以支持许多符号。
在汉字领域,一直到cjk-e的字都是可以支持的。
再算上一些符号,至少已经达到8万以上的字符了。
2015年02月06日 17点02分 7
回复 _光明星_ :我没接触过十万字符……现在我接触过的最大的字符集是海峰五笔码表里的8万多个汉字加符号
2015年02月07日 08点02分
回复
_������_
:这个就是“在电视里见过”和“自己亲眼见过”的区别了……
2015年02月07日 09点02分
回复 _光明星_ :好像是到CJK-D
2015年02月07日 13点02分
@阴阳帐篷 这里写了 Unicode 写了多少字符→http://babelstone.co.uk/Unicode/babelmap.html
2015年02月16日 06点02分
level 12
2015年02月07日 03点02分 10
level 12
2015年02月07日 03点02分 11
这个问题后面几个回复很有意思
2015年02月07日 03点02分
level 14
楼主你忘了utf-16有be和le之分。。。而且还有utf-32,也有be和le之分,不能简单的说unicode就是utf-16
2015年02月07日 10点02分 12
level 11
好复杂
2015年02月07日 11点02分 13
level 1
[乖]
2015年02月16日 07点02分 14
level 1
UTF-8理论上最多可以支持6字节编码
UTF-16也已经升级为2字节和4字节的变长编码了
2022年12月14日 12点12分 15
1