金融时报今天发了一篇报道,说了一下 Deepseek R2 推迟发布的原因 R1 发布后上面鼓励 DeepSeek 用华为的显卡替代英伟达训练 R2 但是在 R2 用华为的过程中遇到了持续的技术问题,最后没办法又换回了英伟达显卡,改成只在推理阶段用。 因为这些耽误的时间导致 Deepseek 5 月以来的模型发布时间赶不上其他公司。 里面说即使华为的技术一直在 DeepSeek 常驻帮忙,但是还是 DeepSeek 没能在华为显卡上执行进行一次成功训练。 另外 R2 推迟发布可能还跟数据标注时间过长有关。 英伟达这个生态是老黄苦心经营那么多年才构建起来的,不能单纯当硬件参数去比较,不只是中国公司不行,美国其他公司除了谷歌的 TPU 也都不行。

来源:https://t.co/6UaQW9Hz1H
发现一个有趣的事情,评论区有些朋友一直在讨论发新闻的目的,而不是新闻内容,另外只是转发不代表完全同意其中观点和信息
我们当然要支持国产显卡和芯片,但是是不是无底线支持,需要不需要牺牲国产模型训练进度和能力去支持