DeepSeek选择华为晶片训练较小模型

Mar 18, 2026· 每日资讯

2025-08-30T21:23:12+08:00 （杭州综合讯）美国科技媒体报道，中国人工智能公司深度求索（DeepSeek）已决定使用华为的人工智能晶片训练一些较小的模型。 The Information引述知情者称，深度求索的这一决定，是因为中国政府向科技公司施压，鼓励它们采用国产晶片，以减少对美国英伟达晶片的依赖。不过，报道也指出，深度求索最大的AI模型，仍会继续使用英伟达的晶片。英国《金融时报》本月中引述消息人士称，正是由于使用了华为处理器，导致深度求索没有按计划在5月发布R2模型。延伸阅读 DeepSeek新模型传因华为晶片问题推迟发布美媒：阿里巴巴研发新AI晶片减少依赖英伟达报道称，深度求索1月发布R1模型后，在中国官方鼓励下改为采用华为的昇腾处理器，却持续遇到技术问题。尽管华为安排技术人员协助，训练仍无法顺利完成。因此，R2模型仍须依赖英伟达晶片进行训练，昇腾晶片则用于模型推理。不过，深度求索据悉仍在与华为合作，探讨如何让昇腾晶片与新模型的推理兼容。深度求索上个星期发布DeepSeek-V3.1模型，被认为是R1的升级版。至于备受关注的R2大模型，公司并未给出确切时间表。中国官方推动科技公司使用国产替代晶片，北京据报向多家公司发出通知，劝阻它们使用英伟达H20晶片。

原文链接: 联合早报