小米开源首个推理大模型Xiaomi MiMo

  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’,联动预训练到后训练,全面提升推理能力。...

  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’ ,联动预训练到后训练,全面提升推理能力。

小米开源首个推理大模型Xiaomi MiMo

  据介绍,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上 ,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview 。

  随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下 ,MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

  值得注意的是,MiMo-7B全系列模型均已开源 。据了解,MiMo 来自小米全新成立不久的“小米大模型Core团队”的初步尝试。(闫妍)

你可能想看:

本文来自作者[admin]投稿,不代表若地号立场,如若转载,请注明出处:https://redac-nomade.com/ygxq/202504-9059.html

(2)

文章推荐

  • 远洋集团:2024年资产负债表尚未修复 重组收益将于2025年释放

      3月26日,远洋集团(03377.HK)发布2024年业绩。受制于房地产行业现状,远洋集团依然处于亏损状态。同时,由于远洋集团2024年全力推进的境外债重组尚未正式生效,百亿量级的重组收益未确认也影响了2024年财报表现。据最新公告披露,远洋集团已顺利完成本金56亿美元的境外债重组全部流程,预计

    2025年03月27日
    27
  • 特朗普关税“大日子”临近 外汇交易员这次却削减对汇率波动的押注

      在日交易量达7.5万亿美元的外汇市场中,曾在特朗普前两个关税关键日期前后押注出现剧烈波动的交易员,这次在4月2日临近之际却采取了新的策略。  根据数据,过去两周,与加元和欧元等货币挂钩的期权波动性相关押注实际上趋于下调。相较于今年早些时候前几个特朗普威胁加关税的日期前后外汇波动率指标的飙升,当

    2025年03月28日
    29
  • 番摊怎么作弊番摊有**之法吗

    何谓”揸流摊”?1、揸流摊又称作揸假摊不是单纯形容人有能力而故意唔尽力去完成一件事。甚至可以说原先不是这么用的。揸流摊是出自赌番摊时行骗的手法!赌番摊是中国特色的赌钱方法其历史起源极古有人认为可能在上古石器时代的人都已有这种形式。2、淡淡的天色,寂寂的田野,火车走着,没人理会一般。天尽头

    2025年03月29日
    23
  • 美国消费者狂囤“大件”

      据央视新闻消息,当地时间4月5日,据美国广播公司报道,美国消费者正因关税而“疯狂采购”各类商品,以防止美国总统特朗普加征关税而抬高物价。  报道称,一位名叫诺埃尔·佩格罗的纽约市居民一周内在汽车零件、园艺用品和电子产品上花了约3500美元,购买了包括一台40英寸的海信电视和一台笔记本电脑在内

    2025年04月06日
    27
  • 长江有色:11日锌价下跌 日内交易大幅降温

      今日沪期锌走势:今日沪期锌偏强上扬,沪锌2505主力合约开盘价22575元,盘中高点22735元,低点22430元,结算价22380元,收盘22660元/吨,涨280元,涨幅1.25%。今日沪锌2505主力合约成交量133336手减少92535手,持仓量64481手减少4670手。沪期锌2

    2025年04月11日
    23
  • 直面噪音污染:华为音频以双向静谧通话技术保障高效交流

      2025年4月16日,我们迎来了第23个“世界噪音日”。其旨在唤醒人们关注日益严重的噪音污染问题,倡导对噪声的有效控制与管理,共同营造更宁静、健康的声学环境。  多重危害显现噪音成在线沟通“拦路虎”  噪音污染,已被公认为继空气污染、水污染之后的人类环境第三大公害。长期暴露于超标噪音环境中

    2025年04月16日
    22
  • 甘肃新增本土确诊17例详情公布(甘肃新增本土确诊病例17例)

    来源:甘肃卫健委现将10月22日0-24时甘肃省新冠肺炎疫情信息公布如下:本地疫情:10月22日0-24时,甘肃省新增确诊病例17例其中,兰州13例(12例为云南旅行团成员、1例为无症状转为确诊病例),张掖2例、嘉峪关1例、陇南1例。现有本土确诊病例35例。具体信息如下:病例111:彭某某,女,75

    2025年04月19日
    19
  • 2025年基金一季报划重点!泓德丰泽: 关注内需消费,更多聚焦企业竞争力和估值水平

      2025年一季度泓德丰泽混合(LOF)基金份额净值增长率为7.93%,同期业绩比较基准收益率为-0.52%。基金自2019年3月28日成立以来累计净值增长率69.73%,同期业绩比较基准收益率为8.55%。  一季度在DeepSeek、哪吒等事件的催化下,市场情绪高涨,AI、机器人等热点轮番

    2025年04月23日
    21
  • 中移金科副总经理孙健:保险业正从传统销售方式向基于AI保险销售智能体的“第四渠道”演进

    专题:2025保险科技峰会  4月25日金融一线消息,“2025保险科技峰会”今**深圳正式举行,本次大会主题为“从互联网时代到AI时代,AI+保险的战略推进与应用创新”。会上,中移金科与众安信科AI+保险联合实验室正式亮相。中移金科副总经理孙健表示,期待实验室的成果转化落地,生根发芽。  孙

    2025年04月25日
    18
  • 伟鸿集团控股:预期2024年年报将于2025年5月底前刊发

      伟鸿集团控股(03321)发布公告,2024年年度业绩的发布将进一步延迟至2025年5月5日(星期一)。公司于过去数天已尽最大努力整理并提供资料,以供核数师执行所需的审核程序,然而,若干银行确认函及估值报告仍然未完成;且若干财务数据仍待核数师的审查结论。基于目前进度,预期2024年年报将于20

    2025年04月29日
    9

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年04月30日

    我是若地号的签约作者“admin”!

  • admin
    admin 2025年04月30日

    希望本篇文章《小米开源首个推理大模型Xiaomi MiMo》能对你有所帮助!

  • admin
    admin 2025年04月30日

    本站[若地号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年04月30日

    本文概览:  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’,联动预训练到后训练,全面提升推理能力。...

    咨询

    联系我们

    邮件:若地号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们