央企首家！中国挪动助力中国石油实现DeepSeek全栈

2月8日，在中国挪动的助力下，中国石油高效实现DeepSeek V3/R1全栈国产化的训推适配跟私有化安排。此次安排，基于DeepSeek的要害技巧点，发展了系列基本模子算法翻新，实现了从底层芯片到框架、模子的全栈自立可控，为推进人工智能技巧在动力化工范畴的深度利用与国产AI技巧生态的范围化落地注入了强盛能源。始终以来，中国挪动与中国石油两年夜央企踊跃呼应国度人工智能策略，尽力推进 “人工智能 +” 在动力化工行业落地生根。此前，中国挪动联袂中国石油宣布动力化工范畴首个行业年夜模子——700亿参数昆仑年夜模子，助力中国石油打造“五个一”：建立一个央企当先的算力核心，一个会合同一AI中台，一套高品质行业数据集，一套海内当先的行业年夜模子、一系列翻新利用。面临中国石油多模态、超百亿参数的年夜模子练习义务需要，挪动云凭仗强盛的算力收集才能，实现了资本的疾速呼应、弹性扩大及高品质供应。经由过程为中国石油构建“算力泛在、算网共生、智能迅速、保险牢靠、绿色低碳”的一体化算力系统，挪动云已供给超越1000P的稳固算力资本，为年夜模子的建立跟运转供给了坚固的算力保证。为了使DeepSeek系列模子在昆仑年夜模子原有的框架下，取得更好的适配后果跟履行机能，中国挪动第一时光发展相干的剖析、适配与翻新任务。中国挪动经由过程设置化开辟，在DeepSeek V3模子基本上疾速实现了自界说模子参数跟范围的针对性优化。团队在不现实启动集群练习义务的情形下，仅经由过程单卡即模仿出集群中全部卡的内存占用情形，从而制订团体的集群散布式练习战略。中国挪动复现并优化了DeepSeek MTP多Tokens猜测功效，经由过程DeepSeek-V3/R1主模子跟MTP Module的散布式调理，实现一次解码天生多个Token，并经由过程使整图编译功效，组共计算图的通用算子，实现主动融会减速，晋升DeepSeek-V3/R1端到真个推感性能。此次DeepSeek年夜模子的胜利安排，为中国政企客户实现DeepSeek V3/R1全栈国产化的训推适配跟安排供给了主要参考。它也为中国石油昆仑年夜模子优化利用后果、收缩研发周期、构建安康生态供给了新引擎，推进“数智中国石油”建立步入慢车道。在利用层面，昆仑年夜模子的问许可用“行业各人”现在已新增DeepSeek深度推理才能。用户在应用该利用时，除了能够失掉昆仑年夜模子天生的动力化工范畴专业问答成果，还能抉择“深度思考”形式，休会常识推理、场景懂得等AI效劳。在模子层面，昆仑年夜模子的AI中台模子广场现在已上线DeepSeek-V3与DeepSeek-R1模子版本，并实现全尺寸适配，用户可基于AI中台挪用DeepSeek模子API效劳，并应用AI中台组件及东西构建智能体，以满意差别场景的需要。将来，中国挪动与中国石油将持续联袂共进，在油气勘察开辟、炼油化工、油气贩卖、工程建立等中心营业范畴深刻发掘AI潜力，以新质出产力为中国式古代化建立奉献力气。