24

周四

201910

>

 快讯

  • 森马服饰:2025一季度净利润2亿元,同比下降38%

    4月28日,森马服饰披露一季报,2025年第一季度实现营业收入30.79亿元,同比下降1.93%;归属于上市公司股东的净利润2.14亿元,同比下降38.12%。从资产方面看,公司报告期内,期末资产总计为187.95亿元,应收账款为12.17亿元;现金流量方面,经营活动产生的现金流量净额为1.53亿元,销售商品、提供劳务收到的现金为38.43亿元。


    2天前
  • 斯凯奇:2025第一季度营收24亿美元,同比增长7.1%

    由于全球贸易政策带来的经济不确定性,斯凯奇撤回了2025财年的业绩指引。尽管撤回业绩指引,但斯凯奇第一季度销售额仍增长了7.1%,达到24.1亿美元,略低于分析师预期的24.3亿美元。第一季度利润从去年同期的2.066亿美元降至2.024亿美元,但每股收益从1.33美元升至1.34美元,高于分析师预期的1.17美元。欧洲、中东和非洲地区销售额增长14%,美洲地区增长8%,而中国市场销售额同比下降16%。


    2天前
  • 伊利开拓新品类,入局婴儿水

    4月27日,伊利金领冠在长白山举办泉爱宝贝婴儿水新品发布会,发布宝宝专属饮用低钠淡矿水,标志着这家乳业巨头正式进军婴幼儿饮用水领域。据悉,伊利泉爱宝贝婴儿水选用长白山松花泉水源,并采取瞬时高温灭菌工艺、4重微米级过滤系统。值得注意的是,伊利并未将这款婴儿水视作简单的快消品,而是纳入金领冠品牌旗下与奶粉冲泡场景形成强关联,进而对接母婴群体的实际需求。


    2天前
  • 「泡泡玛特」登顶美国 AppStore 购物榜

    4月25日,泡泡玛特App登顶美国App Store购物榜,这也是该官方应用在购物榜的首次登顶,并一跃成为App Store免费总榜的第四名。(北京日报)

    2天前
  • 美国电商平台集体提价

    近期特朗普关税政策导致全球贸易紧张局势加剧,商家运营成本上升。据美国媒体4月25日报道,美国亚马逊等电商平台上不少商家已经开始提高商品的售价。根据一家价格分析机构提供的数据,自4月9日以来,美国亚马逊网站上近1000种商品的价格出现明显上涨,涵盖服装、家居用品、电子产品和玩具等多个类别,平均涨价幅度接近30%。包括Temu、希音等多个跨境电商平台均已发布公告称,由于“近期全球贸易规则及关税变动”导致运营成本上升,将从4月25日开始实施价格调整。社交媒体上也有大量美国网友感叹道,一夜之间购物车里的东西都变贵了。 (央视财经)

    2天前

 母婴行业观察

马斯克:这是我见过的对DeepSeek最透彻分析

产业

小小刀

阅读数: 1082

( 0 )

( 0 )

( 0 )

2025-02-05 11:41


1738726588603.jpg

“马斯克评论: “有趣的分析。我所见过的最好的。”“AI将无处不在。”


这些天正好春节放假,我看了不少DeepSeek的很多前前后后的报道与分析,春节前周一最后一个股票交易日,开盘前就在在涨停价格上提交了订单,可惜订单太多了,没有买到。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍


很佩服DeepSeek的逻辑,相当于重新做了一个生态登上了光明顶。条条大路通罗马,但是在第一个通关之前,大家主要是信心不足,我相信后面更多的可能会惊讶到我们。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍


不要说上学没啥用,上学可能没有达到你想要的预期,但是不上学一定更大概率达不到你的预期。而且人的一生中达不到自己预期是大概率事件,好好上学是一切可能的底层基础。这次DeepSeek的创始人是梁文锋教育背景:梁文锋本硕均就读于浙江大学信息与电子工程学专业。据说也是当年的状元。


1738726639745.jpg


之前胡润百富榜创始人胡润作为一个英国人分享他看到的中国富豪排行榜上榜富豪的特点或者说变化。之前都是都是资源打天下,谁胆子大谁就能赢。这些年上榜的富豪,基本上都是科技互联网相关的,他们的特点是财富在短时间内几何级数增长,比之前的富豪财富量级大时间短。还有个特点就是这些年新上榜的富豪,都是高学历背景,而且很多不但是高学历还都是学霸,这也是非常明显的一个特点。


DeepSeekr1的真相与细节


真实情况:


1、它在相关AppStore类别中下载量排名第一。明显领先于ChatGPT,这是Gemini 和Claude都未能实现的。


2、从质量角度来看,它与o1相当,但仍落后于o3。


3、实现了真正的算法突破,使其在训练和推理方面都大大提高了效率。FP8训练、MLA和多token预测都具有重要意义。


4、容易验证r1的训练成本仅为600万美元。虽然这在字面上是真实的,但也极具误导性。


5、即使他们的硬件架构也很新颖,值得注意的是他们使用PCI-Express 进行扩展。


重要细节:


1、根据技术论文,600万美元并不包括“与前期研究和架构、算法和数据消融实验相关的成本”。这意味着,只有在实验室已经在前期研究上投入数亿美元并且能够访问更大规模集群的情况下,才有可能以600万美元的成本训练出r1质量的模型。‍‍


DeepSeek显然拥有远超2048个H800的算力;他们早期的一篇论文提到拥有 10000个A100的集群。一个同样聪明的团队不可能仅凭600万美元就能启动 2000个GPU集群并从头开始训练r1。大约20%的Nvidia收入来自新加坡。尽管他们尽了最大努力,但20%的NvidiaGPU可能并不在新加坡。‍


2、存在大量的知识蒸馏——也就是说,如果没有对GPT-4o和o1的无障碍访问,他们可能无法完成这个训练。正如@altcap昨天向我指出的,限制前沿GPU的访问权限却不对中国蒸馏美国前沿模型的能力采取任何措施,这很有趣——显然违背了出口限制的目的。为什么要买牛,如果可以免费获得牛奶?


核心发现:


DeepSeekr1确实具有重要意义,但需要注意一些细微差别。最重要的是 r1在推理成本上比o1低得多且效率更高,这比600万美元的训练成本更具意义。r1的每次 API 调用成本比o1低93%,可以在高端工作站上本地运行,而且似乎没有遇到任何速率限制,这很不可思议。简单计算一下,每 10亿个活跃参数在 FP8下需要1GB的 RAM,因此 r1 需要 37GB 的 RAM。批处理大大降低了成本,更多的计算能力增加了每秒 token 数,所以云端推理仍然具有优势。还要注意,这里存在真正的地缘政治动态,我认为这在“Stargate”之后发布并非巧合。再见了,5000亿美元——我们几乎都还没认识你。


结论要点:


1、降低训练成本将提高 AI 的投资回报率。


2、在短期内,这对训练资本支出或“能源”主题都不会产生积极影响。


3、目前“AI基础设施”赢家(跨科技、工业、公用事业和能源领域)面临的最大风险是:r1的精简版本可以在高端工作站(如有人提到的 Mac Studio Pro)上本地运行。这意味着类似的模型将在约2年内可以在高性能手机上运行。如果推理计算转移到边缘设备是因为“够用了”,那么我们将面临一个截然不同的世界,出现不同的赢家——即我们将见证有史以来最大规模的PC和智能手机升级周期。计算能力一直在集中化和去中心化之间摆动。


4、人工超级智能(ASI)已经非常接近,但没有人真正知道超级智能的经济回报会是什么。如果一个耗资1000亿美元、在10万多个Blackwells(o5、Gemini3、Grok4)上训练的推理模型能够治愈癌症和发明曲速引擎,那么ASI的回报将非常高,训练资本支出和能源消耗将稳步增长;戴森球将重新成为解释费米悖论的最佳理论。我希望ASI的回报是高的——那将太棒了。


5、这对于使用AI的公司都非常有利:软件、互联网等。


6、从经济角度来看,这极大地提升了分发渠道和独特数据的价值——YouTube、Facebook、Instagram和X。


7、美国的实验室可能会停止发布其前沿模型,以防止对r1至关重要的知识蒸馏,尽管在这方面,猫可能已经完全跑出了袋子。即r1可能足以训练r2等。


Grok-3的影响


Grok-3的出现可能会显著影响上述结论。这将是自GPT-4以来首次对预训练扩展定律的重要测试。就像花了几周时间通过强化学习将v3转变为r1一样,运行必要的强化学习来提高Grok-3的推理能力也可能需要几周时间。基础模型越好,推理模型就应该越好,因为三个扩展定律是相乘的——预训练、后训练期间的强化学习,以及推理过程中的测试时计算(这是强化学习的函数)。Grok-3已经表明它可以完成超出o1的任务——参见Tesseract演示——超出多少将变得很重要。用《双塔奇兵》中一个匿名兽人的话来说,“肉可能很快就会重新上菜”。时间会告诉我们答案,“当事实改变时,我就改变主意。”(来源:市场资讯来源:AI智见录)


文章来源:母婴行业观察




版权声明:转载母婴行业观察的原创文章,需注明文章来源以及作者名称。公众号转载请联系开白小助手(微信号:zhangxiaoxian1015)。违规转载法律必究。


扫描二维码,第一时间获取母婴行业的资讯和动态。
从此和母婴行业观察建立直接联系。

参与评论

登录后才可以留言!

本栏目文字内容归myguancha.com所有,任何单位及个人未经许可,不得擅自转载使用。

Copyright © 母婴行业观察 |  京ICP备12043030号-6