IT之家 2 月 27 日消息,腾讯混元新一代快思考模型 Turbo S 今日正式发布。
腾讯官方表示,区别于 Deepseek R1、混元 T1 等需要“想一下再回答”的慢思考模型,混元 Turbo S 能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低 44%。
在业界通用的多个公开 Benchmark 上,混元 Turbo S 在知识、数学、推理等多个领域,展现出对标 DeepSeek V3、GPT 4o、Claude 等一系列业模型的效果表现。
架构方面,混元 Turbo S 采用 Hybrid-Mamba-Transformer 融合模式,降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,实现训练和推理成本的下降。
腾讯还称,新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题。一方面,发挥了 Mamba 高效处理长序列的能力;另一方面,也保留 Transformer 擅于捕捉复杂上下文的优势,最终构建了显存与计算效率双优的混合架构。
这也是“工业界首次”成功将 Mamba 架构无损地应用在超大型 MoE 模型上。通过模型架构上的技术创新,混元 Turbo S 部署成本大幅下降。
作为旗舰模型,混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。
基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,混元也推出了具备深度思考的推理模型 T1。
IT之家从腾讯公告获悉,当前,开发者和企业用户已经可以在腾讯云上通过 API 调用腾讯混元 Turbo S ,即日起一周内免费试用。
定价上,Turbo S 输入价格为 0.8 元 / 百万 tokens,输出价格为 2 元 / 百万 tokens。
腾讯元宝即将逐步灰度上线混元 Turbo S,用户在元宝内选择“Hunyuan”模型并关闭深度思考即可体验使用。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.