
价格差了 20 倍,效果却差得有限:大模型的价格墙正在松动
TLDR
同一份代码审计任务,MiniMax M3 花 $0.07 找到 13 个问题,Claude Opus 4.8 最贵一档花 $3.39 也不过找到 15 个——便宜模型正在逼近专有模型的能力边界,这个趋势值得每个重度使用 LLM 的开发者认真对待。
引言
大模型的定价,一直有一道隐形的逻辑:贵的就是好的,好的就该贵。
这个逻辑最近开始动摇。Kilo 上周发布了一次测试:用同一份预埋了 17 个已知问题的 webhook 服务代码,分别让 Claude Opus 4.8 和 MiniMax M3 做代码审计,记录每次运行的费用、耗时和发现问题数。结果有点让人意外——MiniMax M3 花了 $0.07,找到了 13 个问题;Claude Opus 4.8 最便宜的一档花了 $1.30,同样找到 13 个;最贵的 max 档花了 $3.39,也不过找到 15 个。





