Meta发布人工智能新模型系列 Llama 4

  Meta公司在周六发布了其 Llama 系列中的一组新的人工智能模型 ——Llama 4。   该系列总共有四个新模型:Llama 4 Scout、Llama 4 Mav...

Meta发布人工智能新模型系列 Llama 4

  Meta公司在周六发布了其 Llama 系列中的一组新的人工智能模型 ——Llama 4 。

  该系列总共有四个新模型:Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。Meta 称,所有这些模型都经过了 “大量未标注的文本 、图像和视频数据” 的训练 ,以使它们具备 “广泛的视觉理解能力 ”。

Meta发布人工智能新模型系列 Llama 4

  Scout 和 Maverick 模型在Llama.com网站以及 Meta 的合作伙伴(包括人工智能开发平台 Hugging Face)处均可公开获取,而 Behemoth 模型仍在训练中 。Meta 表示,其人工智能助手 Meta AI(应用于 WhatsApp、Messenger 和 Instagram 等应用程序)已在 40 个国家更新为使用 Llama 4 模型 。目前 ,多模态功能仅在美国以英语提供。

  一些开发者可能会对 Llama 4 模型的使用许可持异议。

  “位于” 欧盟或 “主要营业地” 在欧盟的用户和公司被禁止使用或分发这些模型 ,这可能是该地区人工智能和数据隐私法律所施加的监管要求导致的结果(过去,Meta 曾谴责这些法律过于繁琐) 。此外,与之前发布的 Llama 模型一样 ,月活跃用户超过 7 亿的公司必须向 Meta 申请特殊许可,Meta 可自行决定是否授予该许可。

  Meta 在一篇博客文章中写道:“这些 Llama 4 模型标志着 Llama 生态系统新时代的开始。这仅仅是 Llama 4 系列的开端 。 ”

Meta发布人工智能新模型系列 Llama 4

  Meta 表示,Llama 4 是其首个采用混合专家(MoE)架构的模型系列 ,这种架构在训练和回答查询时计算效率更高。混合专家架构基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的 “专家 ” 模型。

  例如,Maverick 总共有 4000 亿个参数 ,但在 128 个 “专家” 模型中只有 170 亿个活跃参数(参数数量大致与模型的问题解决能力相对应) 。Scout 有 170 亿个活跃参数 、16 个 “专家” 模型以及总计 1090 亿个参数。

  根据 Meta 的内部测试,Maverick 最适合用于 “通用助手和聊天 ” 等应用场景,比如创意写作 ,在某些编码 、推理、多语言、长文本上下文和图像基准测试中,其表现超过了 OpenAI 的 GPT-4o 和谷歌的 Gemini 2.0 等模型。然而,Maverick 与谷歌的 Gemini 2.5 Pro 、Anthropic 的 Claude 3.7 Sonnet 和 OpenAI 的 GPT-4.5 等功能更强大的最新模型相比 ,仍有一定差距 。

  Scout 的优势在于文档摘要以及对大型代码库的推理等任务。独特的是 ,它拥有非常大的上下文窗口:1000 万个词元(“词元” 代表原始文本的片段,例如单词 “fantastic” 可拆分为 “fan ”、“tas” 和 “tic”)。简单来说,Scout 可以处理图像以及多达数百万字的文本 ,使其能够处理和使用极其冗长的文档 。

  根据 Meta 的计算,Scout 可以在单个英伟达 H100 GPU 上运行,而 Maverick 则需要英伟达 H100 DGX 系统或同等设备 。

  Meta 尚未发布的 Behemoth 模型将需要更强大的硬件支持。据该公司称 ,Behemoth 有 2880 亿个活跃参数、16 个 “专家 ” 模型,总参数数量接近 2 万亿个。Meta 的内部基准测试显示,在一些衡量解决数学问题等科学 、技术、工程和数学(STEM)技能的评估中 ,Behemoth 的表现优于 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro(但不如 Gemini 2.5 Pro) 。

  值得注意的是,Llama 4 系列中没有一个模型是像 OpenAI 的 o1 和 o3-mini 那样真正意义上的 “推理” 模型。推理模型会对其答案进行事实核查,并且通常能更可靠地回答问题 ,但因此也比传统的 “非推理” 模型花费更长的时间来给出答案。

Meta发布人工智能新模型系列 Llama 4

  有趣的是,Meta 表示,他们对所有 Llama 4 模型进行了优化 ,使其更少拒绝回答 “有争议的 ” 问题 。据该公司称 ,Llama 4 能够回答之前的 Llama 模型不会回答的 “有争议的” 政治和社会话题。此外,该公司还表示,Llama 4 在处理那些它完全不会回应的提示时 “更加平衡”。

  Meta 的一位发言人告诉meiti:“你可以指望 [Llama 4] 提供有用的 、基于事实的回答 ,且不带任何评判 。我们会继续让 Llama 模型更具响应性,以便它能回答更多问题,能够回应各种不同的观点…… 并且不会偏袒某些观点而忽视其他观点。 ”

  这些调整是在一些白宫盟友指责人工智能聊天机器人在政治上过于 “觉醒 ” 的背景下做出的。

  美国总统唐纳德・特朗普的许多亲信 ,包括亿万富翁埃隆・马斯克以及加密货币和人工智能 “沙皇” 大卫・萨克斯,都声称流行的人工智能聊天机器人审查保守派观点 。萨克斯过去曾特别指出 OpenAI 的 ChatGPT “被编程为具有觉醒倾向”,并且在政治话题上不真实。

  实际上 ,人工智能中的偏见是一个棘手的技术问题。马斯克自己的人工智能公司 xAI 也一直在努力开发一款不会偏袒某些政治观点的聊天机器人 。

  尽管如此,包括 OpenAI 在内的公司仍在调整其人工智能模型,使其能够回答比以前更多的问题 ,尤其是与有争议话题相关的问题 。

你可能想看:

本文来自作者[admin]投稿,不代表若地号立场,如若转载,请注明出处:https://redac-nomade.com/qsq/202504-4955.html

(10)

文章推荐

  • 哈尔滨疫情最新公布哈尔滨疫情最新公布轨迹

    回国隔离政策最新2021年12月1、隔离政策更新:自2021年12月起,从泰国回国的旅客必须在登机前21天进行隔离观察或闭环管理,并填写隔离声明书。在获得中国驻泰国使馆发放的绿色健康码的同时,必须提供符合中国入境要求的检测报告,才能登机回国。回国后,旅客还需接受隔离。手续要求:鉴于全球新冠肺炎疫情

    2025年03月24日
    15
  • 空客在新型飞机研发前阐明立场

      空客公司周二透露了其下一款飞机的部分技术,这款飞机将取代其最畅销的A320neo系列飞机,预计在未来10至15年内投入使用。  何时替换这款在市场最繁忙领域与波音737MAX竞争的行业最畅销机型,是纪尧姆・富里在下个月开始第三个三年任期首席执行官时面临的关键决策之一。  空

    2025年03月26日
    12
  • 张文宏解答上海疫情拐点何时来上海疫情张文宏发声

    张文宏接种新冠疫苗,本人对此有何表示?1、作为上海新冠医疗组组长的张文宏,为了充分了解疫苗的实时反应和效果,自然也是接种了疫苗,针对疫苗接种事件,其本人也发表了一定的内容,其表示,对于新冠疫苗,他会通过自己做实验,了解所有的抗体表现以及不适反映,同时它还表示对于新冠的控制,依靠的疫苗而并非隔离。2

    2025年03月27日
    11
  • 郑州什么时候能解封郑州啥时候才能解封

    郑州全面解封时间2022郑州全面解封时间是在2022年12月26日。随着全国疫情防控政策的调整,郑州市也逐步放开了疫情管控措施。在2022年12月26日,郑州市宣布全面解封,标志着该市疫情防控工作取得了重要阶段性成果。这一决定基于多方面的考虑,包括疫情形势的改善、医疗资源的充足以及市民的出行需求等

    2025年03月27日
    13
  • 2017上海车展时间(一篇文章看懂2017年上海车展多款新车)

    2017年的上海国际车展即将开始,又将有众多新车由此登上展示的舞台,简直是一场车粉的饕餮盛宴。这么多新车,我们该从哪里看起呢?如果您也发愁这个问题,那可真是来对地方了,快来跟我们一起看看本届车展的场馆分布和重点新车吧~1馆和2015年的上海车展一样,“上汽天团”依然在1馆进行展出,上汽荣威、上汽名爵

    2025年03月27日
    16
  • 特朗普**联邦裁员引发求职潮 所涉机构工作申请量激增

      特朗普**削减**项目与机构精简引发联邦雇员求职潮,“**效率部”(DOGE)所涉机构的工作申请量激增。  Indeed招聘实验室经济学家AllisonShrivastava指出,这些求职者正进入一个“有点停滞”但目前还算稳定的劳动力市场。  美国劳工部周四发布的新数据凸显了这一点:首次申

    2025年03月28日
    11
  • 收盘:三大股指本周均录得跌幅 关税不确定性与通胀数据引发忧虑

      北京时间3月29日凌晨,美股周五收跌,三大股指本周均录得跌幅。特朗普关税政策的不确定性、美国通胀依旧高涨、个人支出不及预期、消费者信心骤降,引发了市场对美国经济滞胀甚至衰退的担忧。  道指跌715.80点,跌幅为1.69%,报41583.90点;纳指跌481.04点,跌幅为2.70%,报1

    2025年03月29日
    13
  • 六大行补资本“分步走”计划启动,首批四家定增募资5200亿,财政部拟认购5000亿

      财联社3月30日讯(记者梁柯志)今日傍晚,中国银行、建设银行、交通银行和邮储银行同步发布定增募资公告,分别向财政部和中国烟草、中国移动等多家央企增发股份,募资总额为5200亿元。  多位接受采访的机构分析师和银行人士表示,六大行的增资计划去年已经明确,目前落地时机和方式基本符合市场预期。 

    2025年03月31日
    11
  • 硫代**铵:工业与科研中的重要角色(武汉康正申请通过硫代**铵的中间转化生产硫代**锌工艺专利)

    金融界2025年3月17日消息,国家知识产权局信息显示,武汉康正科技有限公司申请一项名为“通过硫代**铵的中间转化生产硫代**锌工艺”的专利,公开号CN119612451A,申请日期为2025年1月。专利摘要显示,本发明公开了通过硫代**铵的中间转化生产硫代**锌工艺,包括S1,首先准备硫代**

    2025年03月31日
    11
  • 2025年4月6日国内生猪价格一览

    来源:中国猪业14.261784345714.12180349614.272180324114.522135345714.92135345714.62135345714.022240345014.6722183506河南省14.622325

    2025年04月06日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年04月06日

    我是若地号的签约作者“admin”!

  • admin
    admin 2025年04月06日

    希望本篇文章《Meta发布人工智能新模型系列 Llama 4》能对你有所帮助!

  • admin
    admin 2025年04月06日

    本站[若地号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年04月06日

    本文概览:  Meta公司在周六发布了其 Llama 系列中的一组新的人工智能模型 ——Llama 4。   该系列总共有四个新模型:Llama 4 Scout、Llama 4 Mav...

    咨询

    联系我们

    邮件:若地号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们