马斯克新模型降价90%!200万token上下文仅3.5元
马斯克旗下人工智能公司xAI于9月19日发布Grok-4-Fast多模态模型,一次性实现三大突破:200万token超长上下文窗口、百万token输出仅需0.5美元(约3.5元人民币)、较前代性能提升40%。该模型采用单一权重集架构,支持指令切换推理模式,大幅降低"思考token"消耗。
据官方介绍,Grok-4-Fast具备原生工具使用能力,可通过强化学习实现上网浏览、代码执行等复杂操作。在GPQA、LMArena等基准测试中,其搜索任务表现尤为突出,部分场景超越同类产品。
但该模型存在明显限制:200万token窗口具体技术方案未透明公开,在金融、法律等专业领域表现不稳定。社区建议用户在生产环境中进行长上下文压测、智能体工作流验证及多模型对比。
目前,该模型已开放免费试用,商用定价为输入0.2美元/百万token,输出0.5美元/百万token,主要面向智能体开发、大规模文本处理等成本敏感型场景。