感觉不同的平台的对各家ai评价都不一样 - deepseek吧

level 5

b站
国外吹GPT5，国内吹kimik2，deepseek拉完了连豆包都不如
zhihu
国外吹克劳德，国内吹deepseek，OpenAI是臭沙包
贴吧
翻来覆去还得是grok，Gemini和硅基deepseek api
关于Gemini3.0Pro
前几天各平台：哇真好用，最NBai
过几天在贴吧和ai写文群：不如2.5Pro，输出字数短，还容易忘人设……

2025年11月29日 04点11分 1

level 7

故事の小黄花🌼

无论哪个平台都没人吹小鲸鱼… 一直都是哈基米和克劳德…GPT偶尔能上桌

2025年11月29日 05点11分 2

安东·斯拉维克

@故事の小黄花🌼 哈基米3就离谱的两天就遍地不如0325了还有ds那个math小模型就不是给咱们用的，牛逼是牛逼但是跑一次数学题就得开销10亿tokens，相当于1000块钱。

2025年11月29日 08点11分

安东·斯拉维克

@清新而笙歌这个贵也是对老百姓而言的不是对友商而言，毕竟同类产品比如说Google deep think满血版跑一次开支估计得数万刀。

2025年11月29日 14点11分

故事の小黄花🌼

@安东·斯拉维克我想说的是知乎是出一个新的就吹一个 [汗]

2025年11月29日 08点11分

drorrew

别闹行吗，ds的开源模型很强。

2025年11月29日 09点11分

吧务

level 11

真心惶惶*

其实讨论这些没有意义，而且会徒生烦恼，早在4月份，我就发现问题不对了，所以就只能一刀切了

2025年11月29日 06点11分 3

level 9

尼达耶945

看要比什么了，每个ai的特长都不一样。比写小说，哪个ai能比的过克劳德4.5？搜索信息哪个能比的过grok4.1？做网页哪个能比的过gemini3？白话文和文言文哪个能比的过deepseek？开源，性价比这块deepseek拉满。所以要具体问题具体看待，现在没有完美的ai。

2025年11月29日 07点11分 4

牧农耕辛K

@尼达耶945 😋反正我是把ds调教得稳定库库出限制级文字了

2025年12月01日 01点12分

WDHACMAN

确实，搞文言文估计国外模型都不行

2025年11月29日 13点11分

465亿光年

neta的那个怎么样？

2025年12月01日 16点12分

尼达耶945

@牧农耕辛K 这个所有ai都可以，deepseek几乎等于无甲，而且质量也不低。

2025年12月01日 16点12分

level 1

888Godking888

我之前觉得问同样的问题qwen比ds快得多，好一点；但是又用了会，不确定什么原因，发现qwen错误率似乎比ds高，ds慢点但是问题出得少

2025年11月29日 07点11分 5

level 6

digduw😳

其实都差不多，擅长的领域不一样，没有全包围的

2025年11月29日 08点11分 6

level 1

伤痕累累的迷途羔羊

就现在的科技水平，不应该看这些人尽皆知的评价，最要的是能够辅助我们，哪个好用就用那个

2025年11月29日 08点11分 7

level 1

队长_TC9527

小鲸鱼在现版本对齐感觉没做好，嘴硬、说教还有幻觉都感知明显，我问快接端子是不是很好的T接方案，他跟我说“绝对不可以！接头要放在接线盒里。”，还有如图所示的抽象事实错误，天天能给我气笑了。
贴吧基本是Claude和Gemini打架，毕竟全在写刘备。GPT总是差点味。

2025年11月29日 08点11分 8

drorrew

同电气，专业问题我最起码问3个ai，gpt，kimi，等等。不然单个ai回答错误率都很高，大概率是专业知识模型库没弄好

2025年11月29日 09点11分

/****/

@drorrew 你可以喂书的，直接把你的专业教材喂给ai然后再提问就行，有能力可以建一个向量库

2025年11月29日 11点11分

土生瑞穗♪

@育华20210904 AI快，就这样

2025年12月01日 02点12分

育华20210904

@/****/ 都有书了，为什么不自己看？一定要AI帮自己去算。

2025年11月30日 03点11分

level 6

菱纱.韩

在我眼里，deepseek永远是最好的

2025年11月29日 08点11分 9

level 7

◎钉钉小助教◎

不一样很正常，用途不一样，而且同一个东西多试几次生成结果也不一样。就像Qwen3max跑分可高了，我简单用了用写个html小游戏结果是一坨屎，同样提示词给Gemini2.5pro就好很多，国产的好几个我都试过都一般，Grok也是一坨屎，像敷衍我一样，比国产还烂根本用不了（前提是都用的免费的），Claude Sonnet 4.5完成这个任务竟然不如Gemini 2.5pro弄出来的精美，Gemini有瑕疵但从完成这个任务来说属于这几个中最好用的了

2025年11月29日 10点11分 11

猫鱼哦º

sonnet我觉得最好的还是Claude3.7sonnet，那个是真的强。上4.0版本以后我Claude的会员都没续了，直接转gemini了，是真的退化

2025年11月30日 14点11分

level 1

楚萱

有没有拍题最强的，一般拍图片ai都理解不了电路结构啊 [呵呵]

2025年11月29日 11点11分 12

level 5

WDHACMAN

g3确实牛叉，不存在乱吹，claude代码好也是共识

2025年11月29日 13点11分 13

level 5

仗马寒蝉

不是，真有人吹kimi k2？难道它有什么擅长的方面吗 [阴险]

2025年11月29日 14点11分 14

安东·斯拉维克

吹能力吧估计是，毕竟它基底模型烂其实也是共识

2025年11月29日 14点11分

贴吧用户_aD8K71a

kimi k2 thinking国内模型中跑分最高

2025年11月29日 15点11分

明心亘青

@安东·斯拉维克 k2 用的啥基底（

2025年11月29日 17点11分

孤风巷尾ლ

有，翻译黄油

2026年03月04日 19点03分

level 2

人丑嘴毒心不好

特长方向不同，不过吧ds最近感觉变笨了 [不高兴]

经常出错

2025年11月29日 14点11分 15

ct9900

这几天我天天骂它

2025年11月29日 18点11分

level 9

NAMER

其实deepseek在某些方面还是可以的。比如同样发一个文档，让ai参照这个文档进行回答。deepseek是真的聊几十条之后还能记得而且遵守，不会失去对这个文档的注意力。然而kimi则不提醒就忘，时不时ocr还发疯，然后你发了聊几条之后就说没看到题目了。豆包就别说了，这方面就纯弱智让它按照一个模板输出，每一次都提醒每一次都不听话。

2025年11月29日 14点11分 16