繁体字代码原理讲解
代码测试吧
全部回复
仅看楼主
level 4
贴吧用户_0aWPQC4
楼主
首先 我们使用了繁体字代码后
这些数字是怎麼回事呢
其实 这要从UNICODE讲起了
2014年12月03日 10点12分
1
level 4
贴吧用户_0aWPQC4
楼主
我们先来看
一到网上找"汉字转UNICODE"之类的 转出来的是揵揶 错了 我打的不是这个
像什麼汉字转UNICODE什麼的啊 其实是以UTF-16为基础的 而不是以纯正的UNICODE码为基础的
2014年12月03日 10点12分
2
昌维001
你有一个关键内容没讲,就是unicode编码方式和实现方式的区别,utf-16是一种实现方式
2015年04月02日 05点04分
level 4
贴吧用户_0aWPQC4
楼主
十进制中的156661是十六进制的263F5
十进制中的156662是十六进制的263F6
UNICODE中的263F5和263F6对应的是......
𦏵和𦏶
这麼说 繁体字代码是以UNICODE为基础的了
那麼为什麼直接打𦏵和𦏶没用呢
2014年12月03日 10点12分
3
level 4
贴吧用户_0aWPQC4
楼主
可能是百度把𦏵之类的转码了
如果是这样的话 繁体字代码可能是将字符转成类似于𦏵的十进制UNICODE值后
不让百度转码
2014年12月03日 10点12分
4
level 4
贴吧用户_0aWPQC4
楼主
我想 百度转码的可能性很大 我们做这个实验来证明:
如果没经过特殊转码话 浏览器是可以把这类十进制UNICODE转换为文字的
我们把一个HTML文件修改成这样
浏览器打开后
2014年12月03日 10点12分
5
level 4
贴吧用户_0aWPQC4
楼主
即使这个html文件用什麼编码方式都会有同样的效果(特殊编码除外)
UTF-16BE也好啊 UTF-8也好啊反正都是这样
2014年12月03日 10点12分
6
level 4
贴吧用户_0aWPQC4
楼主
UTF-16:UNICODE的一种编码方式 当UNICODE码超过U+FFFF时 会使用特别方法编码 文中除特别注明外 讲的都是Big Endian
当UNICODE码超过U+FFFF时 UTF-16会使用特别方法编码 这也是为什麼汉字转UNICODE和实际不同了
2014年12月03日 10点12分
7
level 4
贴吧用户_0aWPQC4
楼主
烂帖子都加精 什么心态
2014年12月07日 04点12分
8
level 4
贴吧用户_0aWPQC4
楼主
Ureys的“繁体字代码最新兼容版”有些人会去掉裏面的繁体字表 其实这是不对的
2014年12月07日 12点12分
9
level 4
贴吧用户_0aWPQC4
楼主
如果自己要补充字表的话 也得按UNICODE顺序来排列 否则可能会失败
我也从繁体字代码一个细节猜测 百度在我们发表字符后 就开始转码了
那就是
https://tieba.baidu.com/f/commit/
这一步我猜测是强制投递至服务器 所以才没受到转码
2014年12月07日 12点12分
11
level 4
贴吧用户_0aWPQC4
楼主
附上Ureys的“繁体字代码最新兼容版” 百度删帖了......
https://tieba.baidu.com/p/3199111218
2014年12月14日 08点12分
13
level 4
贴吧用户_0aWPQC4
楼主
帖子没人看......
2014年12月14日 08点12分
14
level 4
贴吧用户_0aWPQC4
楼主
今天 我们就来揭晓什麼直接打𦏵和𦏶没用的原因
答案是 百度把我们打的&变成了&!
真狠 原来浏览器......
2014年12月20日 06点12分
15
level 4
贴吧用户_0aWPQC4
楼主
讲讲&是什么吧 &是&的实体名称 因此真相大白
2014年12月20日 06点12分
16
贴吧用户_0aWPQC4
改正:应是 就这样 真相大白
2014年12月20日 06点12分
level 1
浓情绕指柔oº
涨知识了。
2014年12月21日 06点12分
17
level 4
贴吧用户_0aWPQC4
楼主
手机代码测试成功 其实我这个手机代码就是通过手机访问电脑网页做到的 测试手机:GT-I8268
2014年12月21日 06点12分
18
level 1
起个名咋这嘛难
看不懂
2015年01月25日 01点01分
20
level 1
昌维001
你有一个关键内容没讲,就是unicode编码方式和实现方式的区别,utf-16是一种实现方式
2015年04月02日 05点04分
21
贴吧用户_0aWPQC4
Unicode本身是个字符集
2015年04月02日 09点04分
佛眼看人间
回复
����Ȫ
:先生能否讲讲“铺高位”原理?Ureys转码器关闭了,B区文字只能人工处理,因为普通unicode转码器遇到B区文字时,十进制就out了,——一个字对应两个代码。人工如何换算B区文字代码?能否赐教?洗耳恭听
2015年04月02日 15点04分
贴吧用户_0aWPQC4
回复
���ۿ��˼�
:电脑不是用二进制的吗
2015年04月03日 08点04分
贴吧用户_0aWPQC4
回复
���ۿ��˼�
:js能实现(转码器没关 换网址了)
2015年04月03日 08点04分
level 1
可爱极了
𦏵
2015年07月18日 03点07分
22
level 2
莫急最紧要快🌈
繁體字
2015年07月25日 18点07分
23
1
2
尾页