Deepseek 惊天大漏洞
deepseek吧
全部回复
仅看楼主
level 5
金鱼噢噢 楼主
实测有效,目前还没修复
2026年05月16日 09点05分 1
level 5
这不是几天前就已经玩过了吗?输出的是训练数据
2026年05月16日 09点05分 2
level 8
感觉挺离谱的,只能说提issue的那个人连大模型发送请求和生成方式的实现过程认识不足,这个是训练数据里就有的内容,和你正在对话的deepseek本身并没法跨用户得到数据,它只是在模拟<think>包裹的思维链,通过续写来随机生成的字符,它会接着你的思考标头一个一个字地生成,之所以会显示在思维链里面,是因为这段内容被思考标签包裹,比如我这里就通过这个方式让它进行了两轮思考
2026年05月16日 10点05分 4
level 7
发<think真的有用
但看起来是训练数据,不是真的用户提问
2026年05月16日 11点05分 5
但是第二次输入就不是随机话题了
2026年05月16日 12点05分
训练数据不是来自用户提问吗?
2026年05月16日 22点05分
挺有价值的,这是暴露了奖励模型的训练方式,因为后面应该还和“思考过程输出结果用<think>标签包裹”类似字样高度绑定,奖励模型通过这些内容进行打分
2026年05月16日 22点05分
level 3
这issue写的也是一股ai味
2026年05月16日 12点05分 6
level 3
2026年05月16日 13点05分 7
level 1
这玩意就不是其他用户的询问,连本地部署都能实现,大概率是训练材料什么的
2026年05月16日 13点05分 8
level 1
这显然是训练数据啊
2026年05月16日 13点05分 9
level 1
如图[呵呵]
不过不是啥大问题,就看有没有想到这方面的罢
2026年05月16日 13点05分 10
level 1
[笑眼]还有老电视剧看
2026年05月16日 13点05分 12
level 1
就算是能偷看训练数据也很有意思吧[笑眼]
2026年05月16日 14点05分 13
level 1
2026年05月16日 14点05分 14
level 11
不就是大模型幻觉?什么xx提的issue
2026年05月16日 14点05分 15
level 1
给干沉默了[呵呵]
2026年05月16日 15点05分 17
level 1
哈哈,有趣[吃瓜]
2026年05月16日 15点05分 18
1 2 3 4 尾页