三牛娱乐资讯

开源即登顶!百度文心思考模型ERNIE-45-21B-A3B-Thinking登顶HugggFace全球模型趋势榜

  ERNIE-4.5-21B-A3B-Thinking 采用了混合专家(MoE) 架构,总参数规模达21B,每个 token 激活 3B参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

  ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

  每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

  苹果秋季发布会新品汇总:史上最薄iPhone Air亮相,全系iPhone迈入高刷时代

  外卖大战有多烧钱:美团打掉9成利润,京东净利腰斩,阿里经调整净利润下降18%

  迷你版LABUBU开售秒光,隐藏款被炒至1900元,泡泡玛特股价反而跌了

  全尺寸行政豪华SUV新标杆,仰望U8L鼎世版正式上市:售价128万元起

  TechWeb微晚报:哪吒汽车已确认债权约51亿元,百度用自主设计芯片训练其AI模型

  哪吒汽车公司账面仅剩1500万元,但已确认债权约51亿元,拖欠工资约4.6亿元

  蚂蚁集团发布AI眼镜技术框架gPass 已率先应用于rokid、小米等品牌

  苹果MacBook Pro所需OLED显示屏有望全部来自三星 消息称双方已签订独家供应协议

  消息称京东方将为iPhone 17 Pro供应200万到300万块OLED显示屏

  消息称Q2全球智能手机销售额超过1000亿美元 苹果一家占比超过40%

  苹果今年还有望推出6款新品 包括Vision Pro和iPad Pro

  台积电连续两月营收超过100亿美元 或预示苹果A19系列芯片在大量出货

  消息称OpenAI已同甲骨文签订3000亿美元算力采购合同 从2027年开始采购

  青云QingCloud EHPC 打造即买即用的全流程SaaS化超算服务

  蚂蚁链发布BTN:可将区块链网络吞吐量提升186% 带宽成本降低80%

  蚂蚁自研数据库OceanBase宣布开源 300万行核心代码向社区开放