自建低成本生成式人工智能的热潮才刚刚开始

  据报道,OpenAI 正以 3000 亿美元的更高估值筹集更多资金,但对基于生成式人工智能热潮的大型科技股泡沫的担忧,已经削弱了市场领先企业的地位。...

自建低成本生成式人工智能的热潮才刚刚开始

  据报道 ,OpenAI 正以 3000 亿美元的更高估值筹集更多资金 ,但对基于生成式人工智能热潮的大型科技股泡沫的担忧,已经削弱了市场领先企业的地位。

  中国的 DeepSeek 的出现是一个主要原因,现在 ,数十亿美元的人工智能数据中心建设正受到审视,阿里巴巴联合创始人蔡崇信最近也发出了警告 。

  但在斯坦福大学和加州大学伯克利分校等顶尖学校的计算机科学家当中,仅需 30 美元就能构建一个大语言模型的能力 ,带来了 “顿悟 ” 时刻 。

  当 DeepSeek 发布其 R1 模型,并声称仅花费 600 万美元就实现了其生成式人工智能大语言模型时,包括微软投资的 OpenAI 在内的美国人工智能市场领先企业所投入的数十亿美元资金 ,立即受到了审视。

  DeepSeek 的成本分析仍然受到怀疑,投资者对 OpenAI 的信心也并未减弱。据报道,它准备以高达 3000 亿美元的估值进行一轮 400 亿美元的融资 ,并表示今年的收入将增长两倍,达到 127 亿美元 。热门人工智能芯片公司 CoreWeave 本周也希望重振不稳定的首次公开募股(IPO)市场,并开启人工智能股票发行热潮。但对人工智能市场是否发展过快、支出水平是否过高的担忧也并未停止。

  今年到目前为止 ,“七巨头 ” 科技股一直是市场表现最差的股票之一 ,就在本周,阿里巴巴联合创始人蔡崇信警告称,他看到了美国人工智能泡沫正在形成的迹象 。随着对人工智能发展以及美国在人工智能竞赛中领先地位的预期不断调整 ,其影响已经广泛蔓延,从要求实施更严厉的芯片禁运以减缓中国的发展,到另一方面 ,风险投资家们向中国的人工智能开发者投入更多资金。

  但对于美国人工智能领域的一些人来说,一切仍在全速前进,因为生成式人工智能领域的廉价采购热潮 ,让研究人员能够以前所未有的方式推动大语言模型的构建能力,而在 DeepSeek 出现之前,他们似乎无法做到这一点。

  加州大学伯克利分校的研究人员是最早对 DeepSeek 进行小规模语言模型复现的团队之一 ,而且仅花费了 30 美元 。这是在公共云上租用两块英伟达 H200 图形处理器(GPU),并使用一个简单游戏来训练 “30 亿参数”(3B)模型的费用 —— 这里的 “30 亿” 指的是模型中的参数数量,实际上比最复杂的大语言模型(其参数数量可达数万亿)要少得多。

  “在 DeepSeek R1 发布后 ,我们立即启动了这个项目。 ”TinyZero 项目负责人 、该校研究生研究员潘佳怡说 。

  OpenAI 的突破对该团队的研究兴趣同样至关重要 ,潘佳怡表示,他们对一种新的人工智能推理范式很着迷,这种范式 “旨在让人工智能在做出回应之前多花些时间思考”。

  但 DeepSeek R1 是首个有助于解释如何实现这种 “先思考再回答” 能力的公开研究 ,这种能力提高了人工智能模型的性能。“我们非常好奇这种算法是如何工作的 。 ” 潘佳怡说 。但潘佳怡补充道,即便 DeepSeek 据说只花了 600 万美元来训练其 R1 模型,这对他们来说 “还是太贵了”。

  TinyZero 项目背后的主要思路是 ,如果在减小模型规模的同时降低任务复杂度,模型仍然能够展现出涌现的推理行为。这些调整将大幅降低成本,同时仍能让研究人员测试和观察实际的推理行为 。

  人工智能的 “顿悟” 时刻

  为了验证这一思路 ,该团队在一个名为 “倒计时 ”(Countdown)的数学游戏中复现了 DeepSeek R1-Zero 算法,这个游戏更注重推理能力,而不是基于已有的 “领域” 知识(即数学知识)来寻找解决方案。在这个游戏中 ,人工智能需要得出一个目标数字,可以通过加 、减、乘或除来实现。

  起初,TinyZero 采用随机的方法来寻找目标数字;然而 ,经过训练 ,它开始学会调整方法,找到更好、更快的解决方案 。而且,即使任务复杂度和模型规模都降低了 ,该模型仍然能够展现出涌现的推理行为。它通过在游戏的参数范围内学习玩这个游戏,学会了推理。

  “我们证明了,即使是像 30 亿参数这么小的模型 ,也能学会对简单问题进行推理,并开始学会自我验证和寻找更好的解决方案 。” 潘佳怡说。她表示,这是 DeepSeek R1 和 OpenAI o1 发布成果中的一个关键结果 ,通常被称为 “顿悟时刻 ”。

  虽然最大的人工智能模型 、DeepSeek 和 TinyZero 这样的项目之间存在显著差异,但涌现的推理行为是相似的,TinyZero 这样的成功案例表明 ,预算有限的研究人员、工程师和爱好者也能够接触到前沿的人工智能算法 。

  “我们的项目吸引了很多人访问我们在 GitHub 上的页面,复现实验并亲自体验‘顿悟’时刻。” 潘佳怡说。

  斯坦福大学的研究人员最近发布了他们关于使用 “倒计时” 游戏来观察人工智能如何学习的预印本论文,并克服了之前阻碍他们进展的工程挑战 。

  “TinyZero 很棒 。 ” 该项目的首席研究员卡尼什克・甘地说 ,因为它使用了 “倒计时 ” 游戏 ,这是斯坦福团队引入并正在研究的一个任务。

  其他人工智能项目的开源也起到了重要作用,包括由 TikTok 的母公司字节跳动创建的火山引擎强化学习系统(VERL)。“VERL 对我们运行实验至关重要 。” 甘地说。“这种一致性极大地帮助了我们进行实验,并实现了更快的迭代周期。”

  超越 “大实验室 ” ,依靠开源

  斯坦福团队试图理解为什么一些大语言模型在推理能力上有显著提升,而另一些则停滞不前,甘地表示 ,他不再期望与推理、智能和改进相关的计算机科学突破必然来自大型实验室 。“即使在大型实验室内部,对当前大语言模型的科学理解也存在缺失,因为其能力在不断提高。在自主开发人工智能 、开源和学术界方面 ,有很大的空间可以在此做出贡献。” 他说 。

  像斯坦福大学和加州大学伯克利分校的这些项目,将基于如何训练能够自我提高推理能力的模型的研究,带来更多的共享开发成果。

  但即使是这些超低成本的模型 ,也比研究人员所解释的要昂贵。

  人工智能商业咨询公司 OneSix 的高级首席机器学习科学家尼娜・辛格表示,TinyZero 这样的项目的开源方面依赖于在其他基础模型之上进行训练,其中不仅包括 VERL ,还包括阿里云开源的通义千问(Qwen)大语言模型 。“所说的 30 美元训练成本不包括通义千问最初的训练时间 ,阿里巴巴在将其作为开源权重发布之前,在这上面投入了数百万美元。” 她说。

  辛格表示,这并不是对 TinyZero 的批评 ,而是强调了开源权重模型的重要性 —— 即使没有完全开源人工智能数据和架构,这些模型也会向公众发布训练参数,从而推动进一步的研究和创新 。

  “针对特定任务进行微调的较小人工智能模型 ,能够以更小的规模和成本与大得多的模型相媲美 。 ” 辛格说。

  随着越来越多的个人、学者和小型公司期望在无需进行大规模基础设施投资的情况下就能参与到人工智能领域,尝试模仿基础模型的性能并针对特定任务进行微调的趋势正在增长。辛格举了 Sky-T1 的例子,它为用户提供了花费 450 美元训练自己的 o1 模型的能力 ,还有阿里巴巴的通义千问,最低只需 6 美元就能进行人工智能模型的微调 。

  辛格预计,较小项目的开源权重模型将促使主要参与者采用更开放的方法。“自主微调以及社区驱动的模型改进的成功 ,给像 OpenAI 和 Anthropic 这样的公司带来了压力,要求它们为其受 API 限制的模型提供合理依据,尤其是当开源替代方案在特定领域开始达到或超过它们的能力时。” 她说 。

  TinyZero 最重要的发现之一是 ,数据质量和针对特定任务的训练 ,比单纯的模型规模更重要。

  “这是一个重大发现,因为它挑战了行业中普遍存在的观点,即只有像 ChatGPT 或(Anthropic 的)Claude 这样拥有数千亿参数的大规模模型 ,才能够进行自我修正和迭代学习。” 辛格说 。“这个项目表明,我们可能已经越过了一个临界点,即额外增加参数带来的收益在递减 —— 至少对于某些任务来说是这样。 ”

  这意味着人工智能领域的重点可能正在从模型规模转向效率、可及性和有针对性的智能。

  或者正如 TinyZero 团队在项目页面上自己所说:“你可以用不到 30 美元亲自体验‘顿悟’时刻 。”

你可能想看:

本文来自作者[admin]投稿,不代表若地号立场,如若转载,请注明出处:https://redac-nomade.com/shcs/202503-2574.html

(10)

文章推荐

  • 尾盘:主要股指跌幅显著收窄

      北京时间3月22日凌晨,美股周五尾盘跌幅收窄。本周道指与标普指数有望录得涨幅。市场参与者继续评估特朗普关税政策的影响。联邦快递财报发出美国经济未来困难的强烈信号。纽约联储行长称美国经济下行与通胀上行风险都非常高。  道指跌65.03点,跌幅为0.16%,报41888.29点;纳指跌4.16

    2025年03月22日
    11
  • A港科技股杀跌,创业板人工智能逼近阶段低点,小米天量巨震!红利、周期逆市崛起,化工ETF(516020)涨0.8%

      随着“四月决断”临近,A股延续弱势震荡行情。3月25日,三大指数全天窄幅整理,沪指微跌报3369.98点,创指跌0.33%。市场成交额1.29万亿元,连续第2日缩量。  科技股持续低迷,AI主线领衔大跌,龙头寒武纪大跌6.11%。全市场首只的创业板人工智能ETF华宝(159363)场内下挫3.

    2025年03月25日
    14
  • 杭州疫情最新消息今天封城了杭州疫情最新进展

    2022年十月八日宜宾飞望杭州封城没有1、封城了。根据查询杭州市防疫部资料显示,在2022年十月八日,杭州新增6例确诊病例,属于高风险地区,已经封城了,所以乘坐宜宾飞往杭州的航班,在杭州下飞机后会隔离。2、姜玉贞1893年出生,山东菏泽人,中央陆军军官学校毕业,抗日战争中时任第三十四军第六十六师

    2025年03月26日
    9
  • 专家称新冠病毒有点传不动了说新冠病毒不人传人的专家

    新冠病毒去哪儿了,专家有话说1、新冠病毒在目前并没有消失。针对“新冠病毒是否会消失,病毒都去哪了”的问题,专家给出了以下回应:病毒并未消失德国埃森大学医学院病毒研究所教授陆蒙吉明确表示,新冠病毒在目前并没有消失。他提醒公众,不能因为当前疫情的缓解就错误地认为疫情已经结束。2、其实新冠病毒哪里都没

    2025年03月26日
    10
  • 北京社会面筛出一家6口阳性北京一家六口人惨死

    11月11日0至15时北京新增本土感染者70例含社会面6例月11日0时至15时,新增本土新冠肺炎病毒感染者70例,其中,隔离观察人员64例、社会面筛查人员6例;朝阳区33例,海淀区14例,东城区、西城区、昌平区各4例,丰台区、通州区、大兴区各3例,门头沟区、顺义区各1例;重型1例、普通型3例、轻型

    2025年03月28日
    10
  • 金鹰基金杨晓斌:大类资产配置逻辑正在出现变化 保持耐心静待花开

      近期市场调整,或主要由于年报和一季报期临近,市场的悲观情绪再次加大,投资者们对经济和业绩的担忧在敏感期被放大,导致成长股剧烈调整的同时,价值股也被明显拖累。  成长股的调整本身可能源于年初以来对AI相关衍生业态的预期较高后,阶段性回归理性的挤水分,但同时很多基本面明显改善的价值股走势也较为纠结

    2025年03月31日
    9
  • YY直播发布短剧厂牌“麦絮”

      新浪科技讯4月1日午间消息,3月31日,在YY直播生态大会暨麦絮短剧星光点映礼上,YY直播正式宣布成立短剧厂牌“麦絮”,用于自制短剧的宣传和推广。未来,YY将聚焦生态故事,携手旗下公会、主播,联合百度、七猫、爱奇艺、阅文集团等合作伙伴,共同打造YY独有的特色短剧生态。  2024年12月,

    2025年04月01日
    8
  • 金价再创新高突破950元,但金店的生意反而更差了

    来源:@究竟视频微博#金价再创新高金店生意反而更差了#【#金价再创新高突破950元#,但金店的生意反而更差了】4月1日,记者在上海吴江路上的一家周大福门店里咨询销售了解到,今日足金金饰的价格已经达到了953元/克。除了周大福,六福珠宝、潮宏基、谢瑞麟等几家的首饰金价格也达到了953元/克,创

    2025年04月01日
    12
  • 又一家锂电企业正式筹划港股上市

    又一家锂电上市公司宣布发行H股计划。4月1日晚间,中伟股份(300919)正式宣布筹划发行H股股票并上市,公司同日聘请安永香港作为H股发行及上市审计机构。目前,中伟股份正积极与相关中介机构就本次发行并上市的相关工作进行商讨,除本次董事会审议通过的相关议案外,其他关于本次发行并上市的具体细节尚未确定

    2025年04月02日
    13
  • 上海确诊病例(上海昨日新增本土确诊病例144例无症状感染者1305例)

    来源:健康上海123202022年5月11日0—24时,新增本土新冠肺炎确诊病例144例和无症状感染者1305例,其中106例确诊病例为既往无症状感染者转归,38例确诊病例和1303例无症状感染者在隔离管控中发现。新增境外输入性新冠肺炎无症状感染者1例,在闭环管控中发现。本土病例情况2022年5月

    2025年04月02日
    10

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年03月28日

    我是若地号的签约作者“admin”!

  • admin
    admin 2025年03月28日

    希望本篇文章《自建低成本生成式人工智能的热潮才刚刚开始》能对你有所帮助!

  • admin
    admin 2025年03月28日

    本站[若地号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年03月28日

    本文概览:  据报道,OpenAI 正以 3000 亿美元的更高估值筹集更多资金,但对基于生成式人工智能热潮的大型科技股泡沫的担忧,已经削弱了市场领先企业的地位。...

    咨询

    联系我们

    邮件:若地号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们