马斯克：这是我见过的对DeepSeek最透彻分析- 母婴行业观察



周四

2019年10月

快讯

食品委托生产监管新规将实施

近日，市场监管总局发布《食品委托生产监督管理办法》（以下简称《办法》）实施问答。市场监管总局提醒，《办法》将于12月1日起施行。市场监管总局在问答中表示，食品经营者定制、商超自有品牌食品、集团企业内部委托、联名款食品、专供原辅料或半成品、辐照加工环节、多重委托生产食品、仅商标授权等八种情形都属于食品委托生产行为。另外，按照《办法》第三条第二款规定，根据法律法规、食品安全标准和食品生产许可有关要求，需要完整工艺生产的食品，不得将部分环节委托生产。（央广网）

2天前
《营养指导员服务技术指南（试行）》

6月23日，国家卫生健康委员会印发《营养指导员服务技术指南（试行）》的通知。《指南》从五个方面提出具体技术要求：一是营养监测与调查；二是膳食营养状况评价；三是营养咨询与指导；四是营养配餐；五是营养科普教育。

2天前
38.88万件儿童用品被召回

据市场监管总局近日消息，目前，2026年我国共实施儿童用品召回114次，涉及数量38.88万件。其中主要包括：儿童玩具召回48次，涉及数量15.20万件；儿童服装召回22次，涉及数量0.72万件；儿童文具召回19次，涉及数量18.92万件；儿童鞋类召回11次，涉及数量2.43万件。

2天前
天猫国际“全球探源计划”吸引超150个品牌报名

6月24日消息，今年618期间，天猫国际“全球探源计划”首批参与品牌交出亮眼成绩。数据显示，Swisse斯维诗成交破亿元，德国品牌Doppelherz双心成交增长57%，美国品牌Doctor's Best多特倍斯成交增长121%。据悉，天猫国际面向海外品牌开放了“全球探源计划”长期招募通道，目前已有超过150个海外品牌报名，覆盖保健、食品、美妆、母婴、宠物等行业，覆盖全球32个国家和地区。

2天前
百菲乳业拟申请港股上市

6月23日，百菲乳业发布了《关于申请首次公开发行境外上市股份并上市的公告》。据百菲乳业第三届董事会第五次会议审议通过的议案，本次发行的股票为在香港联交所主板挂牌上市的境外上市股份（H股），均为普通股；以人民币标明面值，以外币认购，每股面值为人民币1元。

2天前

母婴行业观察

忽然一周

忽然一周 | 飞鹤与康比特达成合作；保健品等“三品一械” 广告新规征意；孩子王获控股股东及管理层大额增持；爱婴室与亲子坊达成战略合作

忽然一周 | 孩子王打造行业首个线下KOC聚集地；爱婴室首次开放加盟；飞鹤获批进入印尼市场；2026年支持学前教育发展资金金额同增38%

热文

“老年护理第一股”2025营利双增！成人护理用品创收近6亿

再获资本青睐！“沪上阿姨们”用8个亿捧红了1家银发俱乐部

冷门暴利生意！银发修脚小店，居然做成千亿赛道？

2026-04-24 14:02

母婴日报 | 孩子王Q1净利润同比预增40%-80%；3款婴配粉批件信息公布；简爱与京东联合发布儿童饮用酸奶科普指南；河北去年出生人口36万人

2026-04-15 12:59

刚改名就扎进新赛道，养老龙头「福寿康」在下一盘什么棋？

2026-04-17 11:34

马斯克：这是我见过的对DeepSeek最透彻分析

产业

小小刀

阅读数: 2201



( 0 )



( 0 )



( 0 )

2025-02-05 11:41

“马斯克评论： “有趣的分析。我所见过的最好的。”“AI将无处不在。”

这些天正好春节放假，我看了不少DeepSeek的很多前前后后的报道与分析，春节前周一最后一个股票交易日，开盘前就在在涨停价格上提交了订单，可惜订单太多了，没有买到。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

很佩服DeepSeek的逻辑，相当于重新做了一个生态登上了光明顶。条条大路通罗马，但是在第一个通关之前，大家主要是信心不足，我相信后面更多的可能会惊讶到我们。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

不要说上学没啥用，上学可能没有达到你想要的预期，但是不上学一定更大概率达不到你的预期。而且人的一生中达不到自己预期是大概率事件，好好上学是一切可能的底层基础。这次DeepSeek的创始人是梁文锋教育背景：梁文锋本硕均就读于浙江大学信息与电子工程学专业。据说也是当年的状元。

之前胡润百富榜创始人胡润作为一个英国人分享他看到的中国富豪排行榜上榜富豪的特点或者说变化。之前都是都是资源打天下，谁胆子大谁就能赢。这些年上榜的富豪，基本上都是科技互联网相关的，他们的特点是财富在短时间内几何级数增长，比之前的富豪财富量级大时间短。还有个特点就是这些年新上榜的富豪，都是高学历背景，而且很多不但是高学历还都是学霸，这也是非常明显的一个特点。

DeepSeekr1的真相与细节

真实情况：

1、它在相关AppStore类别中下载量排名第一。明显领先于ChatGPT，这是Gemini 和Claude都未能实现的。

2、从质量角度来看，它与o1相当，但仍落后于o3。

3、实现了真正的算法突破，使其在训练和推理方面都大大提高了效率。FP8训练、MLA和多token预测都具有重要意义。

4、容易验证r1的训练成本仅为600万美元。虽然这在字面上是真实的，但也极具误导性。

5、即使他们的硬件架构也很新颖，值得注意的是他们使用PCI-Express 进行扩展。

重要细节：

1、根据技术论文，600万美元并不包括“与前期研究和架构、算法和数据消融实验相关的成本”。这意味着，只有在实验室已经在前期研究上投入数亿美元并且能够访问更大规模集群的情况下，才有可能以600万美元的成本训练出r1质量的模型。‍‍

DeepSeek显然拥有远超2048个H800的算力；他们早期的一篇论文提到拥有 10000个A100的集群。一个同样聪明的团队不可能仅凭600万美元就能启动 2000个GPU集群并从头开始训练r1。大约20%的Nvidia收入来自新加坡。尽管他们尽了最大努力，但20%的NvidiaGPU可能并不在新加坡。‍

2、存在大量的知识蒸馏——也就是说，如果没有对GPT-4o和o1的无障碍访问，他们可能无法完成这个训练。正如@altcap昨天向我指出的，限制前沿GPU的访问权限却不对中国蒸馏美国前沿模型的能力采取任何措施，这很有趣——显然违背了出口限制的目的。为什么要买牛，如果可以免费获得牛奶？

核心发现：

DeepSeekr1确实具有重要意义，但需要注意一些细微差别。最重要的是 r1在推理成本上比o1低得多且效率更高，这比600万美元的训练成本更具意义。r1的每次 API 调用成本比o1低93%，可以在高端工作站上本地运行，而且似乎没有遇到任何速率限制，这很不可思议。简单计算一下，每 10亿个活跃参数在 FP8下需要1GB的 RAM，因此 r1 需要 37GB 的 RAM。批处理大大降低了成本，更多的计算能力增加了每秒 token 数，所以云端推理仍然具有优势。还要注意，这里存在真正的地缘政治动态，我认为这在“Stargate”之后发布并非巧合。再见了，5000亿美元——我们几乎都还没认识你。

结论要点：

1、降低训练成本将提高 AI 的投资回报率。

2、在短期内，这对训练资本支出或“能源”主题都不会产生积极影响。

3、目前“AI基础设施”赢家（跨科技、工业、公用事业和能源领域）面临的最大风险是：r1的精简版本可以在高端工作站（如有人提到的 Mac Studio Pro）上本地运行。这意味着类似的模型将在约2年内可以在高性能手机上运行。如果推理计算转移到边缘设备是因为“够用了”，那么我们将面临一个截然不同的世界，出现不同的赢家——即我们将见证有史以来最大规模的PC和智能手机升级周期。计算能力一直在集中化和去中心化之间摆动。

4、人工超级智能（ASI）已经非常接近，但没有人真正知道超级智能的经济回报会是什么。如果一个耗资1000亿美元、在10万多个Blackwells（o5、Gemini3、Grok4）上训练的推理模型能够治愈癌症和发明曲速引擎，那么ASI的回报将非常高，训练资本支出和能源消耗将稳步增长；戴森球将重新成为解释费米悖论的最佳理论。我希望ASI的回报是高的——那将太棒了。

5、这对于使用AI的公司都非常有利：软件、互联网等。

6、从经济角度来看，这极大地提升了分发渠道和独特数据的价值——YouTube、Facebook、Instagram和X。

7、美国的实验室可能会停止发布其前沿模型，以防止对r1至关重要的知识蒸馏，尽管在这方面，猫可能已经完全跑出了袋子。即r1可能足以训练r2等。

Grok-3的影响

Grok-3的出现可能会显著影响上述结论。这将是自GPT-4以来首次对预训练扩展定律的重要测试。就像花了几周时间通过强化学习将v3转变为r1一样，运行必要的强化学习来提高Grok-3的推理能力也可能需要几周时间。基础模型越好，推理模型就应该越好，因为三个扩展定律是相乘的——预训练、后训练期间的强化学习，以及推理过程中的测试时计算（这是强化学习的函数）。Grok-3已经表明它可以完成超出o1的任务——参见Tesseract演示——超出多少将变得很重要。用《双塔奇兵》中一个匿名兽人的话来说，“肉可能很快就会重新上菜”。时间会告诉我们答案，“当事实改变时，我就改变主意。”（来源：市场资讯来源：AI智见录）

文章来源：母婴行业观察