感觉不同的平台的对各家ai评价都不一样
deepseek吧
全部回复
仅看楼主
level 5
b站
国外吹GPT5,国内吹kimik2,deepseek拉完了连豆包都不如
zhihu
国外吹克劳德,国内吹deepseek,OpenAI是臭沙包
贴吧
翻来覆去还得是grok,Gemini和硅基deepseek api
关于Gemini3.0Pro
前几天各平台:哇真好用,最NBai
过几天在贴吧和ai写文群:不如2.5Pro,输出字数短,还容易忘人设……
2025年11月29日 04点11分 1
level 7
无论哪个平台都没人吹小鲸鱼… 一直都是哈基米和克劳德…GPT偶尔能上桌
2025年11月29日 05点11分 2
@故事の小黄花🌼 哈基米3就离谱的两天就遍地不如0325了 还有ds那个math小模型就不是给咱们用的,牛逼是牛逼但是跑一次数学题就得开销10亿tokens,相当于1000块钱。
2025年11月29日 08点11分
@清新而笙歌 这个贵也是对老百姓而言的不是对友商而言,毕竟同类产品比如说Google deep think满血版跑一次开支估计得数万刀。
2025年11月29日 14点11分
@安东·斯拉维克 我想说的是知乎是出一个新的就吹一个[汗]
2025年11月29日 08点11分
别闹行吗,ds的开源模型很强。
2025年11月29日 09点11分
吧务
level 11
其实讨论这些没有意义,而且会徒生烦恼,早在4月份,我就发现问题不对了,所以就只能一刀切了
2025年11月29日 06点11分 3
level 9
看要比什么了,每个ai的特长都不一样。比写小说,哪个ai能比的过克劳德4.5?搜索信息哪个能比的过grok4.1?做网页哪个能比的过gemini3?白话文和文言文哪个能比的过deepseek?开源,性价比这块deepseek拉满。所以要具体问题具体看待,现在没有完美的ai。
2025年11月29日 07点11分 4
@尼达耶945 😋反正我是把ds调教得稳定库库出限制级文字了
2025年12月01日 01点12分
确实,搞文言文估计国外模型都不行
2025年11月29日 13点11分
neta的那个怎么样?
2025年12月01日 16点12分
@牧农耕辛K 这个所有ai都可以,deepseek几乎等于无甲,而且质量也不低。
2025年12月01日 16点12分
level 1
我之前觉得问同样的问题qwen比ds快得多,好一点;但是又用了会,不确定什么原因,发现qwen错误率似乎比ds高,ds慢点但是问题出得少
2025年11月29日 07点11分 5
level 6
其实都差不多,擅长的领域不一样,没有全包围的
2025年11月29日 08点11分 6
level 1
就现在的科技水平,不应该看这些人尽皆知的评价,最要的是能够辅助我们,哪个好用就用那个
2025年11月29日 08点11分 7
level 1
小鲸鱼在现版本对齐感觉没做好,嘴硬、说教还有幻觉都感知明显,我问快接端子是不是很好的T接方案,他跟我说“绝对不可以!接头要放在接线盒里。”,还有如图所示的抽象事实错误,天天能给我气笑了。
贴吧基本是Claude和Gemini打架,毕竟全在写刘备。GPT总是差点味。
2025年11月29日 08点11分 8
同电气,专业问题我最起码问3个ai,gpt,kimi,等等。不然单个ai回答错误率都很高,大概率是专业知识模型库没弄好
2025年11月29日 09点11分
@drorrew 你可以喂书的,直接把你的专业教材喂给ai然后再提问就行,有能力可以建一个向量库
2025年11月29日 11点11分
@育华20210904 AI快,就这样
2025年12月01日 02点12分
@/****/ 都有书了,为什么不自己看?一定要AI帮自己去算。
2025年11月30日 03点11分
level 6
在我眼里,deepseek永远是最好的
2025年11月29日 08点11分 9
level 7
不一样很正常,用途不一样,而且同一个东西多试几次生成结果也不一样。就像Qwen3max跑分可高了,我简单用了用写个html小游戏结果是一坨屎,同样提示词给Gemini2.5pro就好很多,国产的好几个我都试过都一般,Grok也是一坨屎,像敷衍我一样,比国产还烂根本用不了(前提是都用的免费的),Claude Sonnet 4.5完成这个任务竟然不如Gemini 2.5pro弄出来的精美,Gemini有瑕疵但从完成这个任务来说属于这几个中最好用的了
2025年11月29日 10点11分 11
sonnet我觉得最好的还是Claude3.7sonnet,那个是真的强。上4.0版本以后我Claude的会员都没续了,直接转gemini了,是真的退化
2025年11月30日 14点11分
level 1
有没有拍题最强的,一般拍图片ai都理解不了电路结构啊[呵呵]
2025年11月29日 11点11分 12
level 5
g3确实牛叉,不存在乱吹,claude代码好也是共识
2025年11月29日 13点11分 13
level 5
不是,真有人吹kimi k2?难道它有什么擅长的方面吗[阴险]
2025年11月29日 14点11分 14
吹能力吧估计是,毕竟它基底模型烂其实也是共识
2025年11月29日 14点11分
kimi k2 thinking国内模型中跑分最高
2025年11月29日 15点11分
@安东·斯拉维克 k2 用的啥基底(
2025年11月29日 17点11分
有,翻译黄油[哈哈]
2026年03月04日 19点03分
level 2
特长方向不同,不过吧ds最近感觉变笨了[不高兴]经常出错
2025年11月29日 14点11分 15
这几天我天天骂它[呵呵]
2025年11月29日 18点11分
level 9
其实deepseek在某些方面还是可以的。比如同样发一个文档,让ai参照这个文档进行回答。deepseek是真的聊几十条之后还能记得而且遵守,不会失去对这个文档的注意力。然而kimi则不提醒就忘,时不时ocr还发疯,然后你发了聊几条之后就说没看到题目了。豆包就别说了,这方面就纯弱智让它按照一个模板输出,每一次都提醒每一次都不听话。
2025年11月29日 14点11分 16
1 2 3 尾页