Deepseek 惊天大漏洞
deepseek吧
全部回复
仅看楼主
level 5
金鱼噢噢
楼主
实测有效,目前还没修复
2026年05月16日 09点05分
1
level 5
脳漿炸裂ガール
这不是几天前就已经玩过了吗?输出的是训练数据
2026年05月16日 09点05分
2
level 8
鸡煲启动特别快
感觉挺离谱的,只能说提issue的那个人连大模型发送请求和生成方式的实现过程认识不足,这个是训练数据里就有的内容,和你正在对话的deepseek本身并没法跨用户得到数据,它只是在模拟<think>包裹的思维链,通过续写来随机生成的字符,它会接着你的思考标头一个一个字地生成,之所以会显示在思维链里面,是因为这段内容被思考标签包裹,比如我这里就通过这个方式让它进行了两轮思考
2026年05月16日 10点05分
4
level 7
江上川!
发<think真的有用
但看起来是训练数据,不是真的用户提问
2026年05月16日 11点05分
5
黎明来日
但是第二次输入就不是随机话题了
2026年05月16日 12点05分
SubstitutE
训练数据不是来自用户提问吗?
2026年05月16日 22点05分
基纽特种部队
挺有价值的,这是暴露了奖励模型的训练方式,因为后面应该还和“思考过程输出结果用<think>标签包裹”类似字样高度绑定,奖励模型通过这些内容进行打分
2026年05月16日 22点05分
level 3
LDTP℃
这issue写的也是一股ai味
2026年05月16日 12点05分
6
level 3
撩原原
2026年05月16日 13点05分
7
level 1
贴吧用户_7M61D53
这玩意就不是其他用户的询问,连本地部署都能实现,大概率是训练材料什么的
2026年05月16日 13点05分
8
level 1
下议院议长
这显然是训练数据啊
2026年05月16日 13点05分
9
level 1
OwO⁺
如图
不过不是啥大问题,就看有没有想到这方面的罢
2026年05月16日 13点05分
10
level 1
顺水玉衡
还有老电视剧看
2026年05月16日 13点05分
12
level 1
4195871812
就算是能偷看训练数据也很有意思吧
2026年05月16日 14点05分
13
level 1
OldLyb
2026年05月16日 14点05分
14
level 11
長門有希..
不就是大模型幻觉?什么xx提的issue
2026年05月16日 14点05分
15
level 1
伯伦希尔与休伯利安
给干沉默了
2026年05月16日 15点05分
17
level 1
狂风大作999
哈哈,有趣
2026年05月16日 15点05分
18
1
2
3
4
尾页