2026年5月4日2026年5月4日专题讲座 还在看模型分数?AI评估错了,新框架重新定义AI产品价值 传统MMLU、DAU指标无法衡量AI真实经济价值。来自2026年论文的Outcome Primitives框架,将AI产品评估从‘模型能力’升级为‘现实结果’,并给出结果原语、结果规模、证据等级三维度。