文心大模型4.5 Turbo,源自文心4.5,是效果更好、成本更低的多模态大模型。基于文心4.5 Turbo,X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。
【技术亮点】
1. 基础模型
文心4.5和4.5 Turbo是多模态大模型,实现了文本、图像和视频等不同模态的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、时空维度表征压缩、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。
2. 后训练
研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。
在训练阶段,研制了融合偏好学习的强化学习技术,通过多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。得益于偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑推理和记忆等能力得以全面提升。
3. 深度思考
突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。同时,结合多元统一的奖励机制,实现了长距离思维和行动链的端到端优化,显著提升了跨领域解决问题的能力。
4. 数据
打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据,同时,数据建设流程具备良好的可扩展性,可轻松迁移到全新的数据类型,实现快速、高效的数据生产。具体而言,
针对专业深度知识及领域过程知识的数据稀缺问题,研制了原理驱动、过程评估与结果校验的数据合成技术、知识点驱动的大规模稀缺数据挖掘技术,显著提升数据的知识密度和覆盖面。
多模态数据方面,针对不同模态数据割裂、跨模态语义关联难度大等问题,提出了融合语义对齐的多模态平行数据构建、融合视觉知识的描述生成等技术,大幅提升不同模态数据的对齐精度和深度语义关联,增强多模态理解能力。
【基准测试】
文心4.5 Turbo高效继承文心4.5的文本和多模态能力,同时显著降低训练和推理成本,多模态能力与GPT 4.1持平、优于GPT 4o,文本能力与DeepSeek V3最新版持平,优于GPT 4.5、GPT 4.1、GPT 4o。

文心4.5 Turbo-多模态

文心4.5 Turbo -文本
深度思考模型文心 X1 Turbo整体效果领先DeepSeek R1、V3最新版,略低于GPT o1满血版。

文心X1 Turbo