level 7
一、技术架构本身太难:代际重构,不是小升级
- V4 是完全重做的 MoE 旗舰
- 总参数:约 1.5T(256 专家),推理激活 320~370B
- 百万 Token 上下文 + Engram 记忆 + mHC 流形约束
- 原生多模态、长文本、代码/数学对标 GPT-4o / Claude Opus
- 难度比 V3 稠密架构高一个数量级,训练/推理极不稳定
- V4 Lite 只是“阉割先行版”
- ~200B 参数、简化稀疏、无完整多模态
- 2 月就扔到 APP 测稳定性、测用户反馈
- 本质是:真 V4 没好,先用 Lite 顶班、探底线
2026年04月22日 16点04分
