开云「中国」Kaiyun官网登录入口性能卓越万亿参数的Qwen3-Max模子-开云「中国」Kaiyun官网登录入口
发布日期:2026-02-18 06:25 点击次数:101
2月16日除夜今日,阿里巴巴开源全新一代大模子千问Qwen3.5-Plus,性能失色Gemini 3 Pro。千问3.5终显着底层模子架构的全面改造,这次发布的Qwen3.5-Plus版块总参数为3970亿,激活仅170亿,以小胜大,性能卓越万亿参数的Qwen3-Max模子,部署显存占用裁减60%,推理后果大幅进步,最大推理模糊量可进步至19倍。Qwen3.5-Plus的API价钱每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。
据先容,与前几代的千问诳言语模子不同,千问3.5终显着从纯文本模子到原生多模态模子的代际跃迁。千问3预锤真金不怕火在纯文本Tokens上进行,而千问3.5则基于视觉和文本搀杂token上预锤真金不怕火,并大幅新增中英文、多话语、STEM和推理等数据,以不到40%的参数目赢得超万亿的Qwen3-Max基座模子的顶尖性能:千问3.5在MMLU-Pro常识推理评测中得分87.8分,超越GPT-5.2;在博士级贫穷GPQA测评中斩获88.4分,高于Claude 4.5;在提醒战胜IFBench以76.5分刷新通盘模子记录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5进展均超越Gemini 3 Pro、GPT-5.2。
千问3.5性能跃升的背后,是对Transformer经典架构的紧要改变窒碍。

图注:千问3.5推理后果大幅进步
此外,基于顶级视觉智商,千问3.5也终显着从Agent框架到Agent诈欺的新窒碍。千问3.5可自主操作手机与电脑,高效完成平日任务,在移动端复古更多主流APP与提醒,在PC端可科罚更复杂的多门径操作,如跨诈欺数据整理、自动化历程奉行等,显贵进步操作后果。
同期,千问团队构建了一个可彭胀的Agent异步强化学习框架,端到端可加快3到5倍,并将插件式智能体Agent复古彭胀至百万级范围。
和阿里发布于2025年9月的最强基础模子Qwen3-Max比较,通过锤真金不怕火踏实优化以及多token预测等系列本事,Qwen3.5性能与Qwen3-Max模子握平,并进一步进步了推理后果:在常用的32K高下文场景中,千问3.5推理模糊量可进步8.6倍;在256K超长高下文情况下,Qwen3.5推理模糊量最大进步至19倍,推理后果大幅进步。
当今,千问APP、PC端已第一时刻接入Qwen3.5-Plus模子。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模子,性能更强的旗舰模子Qwen3.5-Max不久也将发布。
最近春节档AI大战愈发猛烈,不单是是多家AI诈欺“撒钱”吸援用户,多个国产大模子也不异上新。
字节跨越旗下AI视频生成模子Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色智商引爆荟萃,诱惑寰球眷注。马斯克转发驳倒Seedance 2.0关联推文,并暗意:模子发展速率太快(It's happening fast),导演贾樟柯在酬酢平台发文暗意:“Seedance 2.0如实强横,我准备用它作念个短片。”
“当今在AI视频生成界限,Seedance可谓是遥遥当先。”业内东说念主士向倾盆新闻记者先容,“在本事智商上,它如实还是卓越Sora(OpenAI旗下视频大模子)和Google Veo3.1、NanoBanana(谷歌旗下图像视频大模子),这是国产大模子第一次在竟然有趣有趣上作念到世界第一,具有标识性有趣有趣。”
2月14日,字节跨越告示推出豆包大模子2.0(Doubao-Seed-2.0)系列。豆包2.0针对大范围出产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。
在本事细节上,豆包方面显露,在话语模子基础智商上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌得益,也超越了Gemini 3 Pro在Putnam基准测试上的进展,数学和推贤惠商达到世界顶尖水平。
阿里千问C端奇迹群总裁吴嘉显露,2月6日,阿里千问APP“春节30亿大免单”认真上线,发起奶茶攻势,请世界东说念主民用AI一句话免费点奶茶,在阿里历史上的春节活动中插足最大。第一天的本色订单达到1500万单,是正本预测的15倍,一度火到用户无法下单,2月14日,千问运行第二波免单活动,将AI大战推向激越。
吴嘉暗意,千问作念这件事的初志,并不是为了和谁卷,从来莫得念念过内卷,竟然念念的是让AI融进老庶民的平日生存场景中,“这是改日一定会发生的事情。”他确信这一波的AI诈欺,中国一定会走活着界的最前哨,模子则会在各家之间的你追我赶中,不停往前发展。
2月12日,智谱认真上线并开源其新一代旗舰模子GLM-5,这个新模子恰是此前在寰球模子劳动平台OpenRouter登顶热度榜首、激发圈内猖獗臆测的秘要模子“Pony Alpha”。
2月13日,MiniMax认真上线新一代文本模子MiniMax M2.5,在编程智商方面,M2.5在巨擘榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显贵进步。
2月13日,据DeepSeek官方显露,DeepSeek网页/ APP正在测试新的长文本模子结构,复古1M高下文,其API 劳动不变开云「中国」Kaiyun官网登录入口,仍为V3.2,仅复古128K高下文。也被外界合计,DeepSeek或将在本年春节再次“炸场”发布新模子,复刻旧年春节局面级震撼。

栏目分类