DeepSeek选择华为晶片训练较小模型
·
每日资讯
2025-08-30T21:23:12+08:00 (杭州综合讯)美国科技媒体报道,中国人工智能公司深度求索(DeepSeek)已决定使用华为的人工智能晶片训练一些较小的模型。 The Information引述知情者称,深度求索的这一决定,是因为中国政府向科技公司施压,鼓励它们采用国产晶片,以 减少对美国英伟达晶片的依赖 。 不过,报道也指出,深度求索最大的AI模型,仍会继续使用英伟达的晶片。 英国《金融时报》本月中引述消息人士称,正是由于使用了华为处理器,导致深度求索没有按计划在5月发布R2模型。 延伸阅读 DeepSeek新模型传因华为晶片问题推迟发布 美媒:阿里巴巴研发新AI晶片减少依赖英伟达 报道称, 深度求索1月发布R1模型 后,在中国官方鼓励下改为采用华为的昇腾处理器,却持续遇到技术问题。尽管华为安排技术人员协助,训练仍无法顺利完成。因此,R2模型仍须依赖英伟达晶片进行训练,昇腾晶片则用于模型推理。 不过,深度求索据悉仍在与华为合作,探讨如何让昇腾晶片与新模型的推理兼容。 深度求索上个星期发布DeepSeek-V3.1模型 ,被认为是R1的升级版。至于备受关注的R2大模型,公司并未给出确切时间表。 中国官方推动科技公司使用国产替代晶片,北京据报向多家公司发出通知,劝阻它们使用英伟达H20晶片。
原文链接: 联合早报
