ERNIE-4.5-21B-A3B-Thinking 采用了混合专家(MoE) 架构,总参数规模达21B,每个 token 激活 3B参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。
ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
苹果秋季发布会新品汇总:史上最薄iPhone Air亮相,全系iPhone迈入高刷时代
外卖大战有多烧钱:美团打掉9成利润,京东净利腰斩,阿里经调整净利润下降18%
迷你版LABUBU开售秒光,隐藏款被炒至1900元,泡泡玛特股价反而跌了
全尺寸行政豪华SUV新标杆,仰望U8L鼎世版正式上市:售价128万元起
TechWeb微晚报:哪吒汽车已确认债权约51亿元,百度用自主设计芯片训练其AI模型
哪吒汽车公司账面仅剩1500万元,但已确认债权约51亿元,拖欠工资约4.6亿元
蚂蚁集团发布AI眼镜技术框架gPass 已率先应用于rokid、小米等品牌
苹果MacBook Pro所需OLED显示屏有望全部来自三星 消息称双方已签订独家供应协议
消息称京东方将为iPhone 17 Pro供应200万到300万块OLED显示屏
消息称Q2全球智能手机销售额超过1000亿美元 苹果一家占比超过40%
苹果今年还有望推出6款新品 包括Vision Pro和iPad Pro
台积电连续两月营收超过100亿美元 或预示苹果A19系列芯片在大量出货
消息称OpenAI已同甲骨文签订3000亿美元算力采购合同 从2027年开始采购
青云QingCloud EHPC 打造即买即用的全流程SaaS化超算服务
蚂蚁链发布BTN:可将区块链网络吞吐量提升186% 带宽成本降低80%
蚂蚁自研数据库OceanBase宣布开源 300万行核心代码向社区开放
电话:400-123-4567
Email: admin@baidu.com
传真:+86-123-4567
手机:13888888888