首页知识课件培训手册计算机行业:DeepSeek掀起国产新浪潮
一方

文档

3632

关注

0

好评

0
PDF

计算机行业:DeepSeek掀起国产新浪潮

阅读 779 下载 47 大小 1.86M 总页数 19 页 2025-02-21 分享
价格:¥ 9.90
下载文档
/ 19
全屏查看
计算机行业:DeepSeek掀起国产新浪潮
还有 19 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 19 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
华西证券股份有限公司HUAXI SECURITIES CO.,LTD证券研究报告|行业动态报告2025年02月8日DeepSeek掀起国产新浪潮计算机行业评级及分析师信息行业评级:推荐国产大模型DeepSeek度彬来教:简单来说,DeepSeek是一款大语言模型(LM),主打“极致性价比”。性能比肩OpenA|的顶尖模型o1,但成本却是GPT-4o的十分之一,API调用成本更是只行业走势图有0 penAl的三十分之一。应用上线20天,日活用户就突破2000万,服务器难以快速响应,导致用户使用体验不佳。国内算力支持企业搭建国产服务器部署为DeepSeek的模型训练提供了强大的算力支持,加速对DeepSeek本地部署,华为云、腾讯云、阿里云、百度智能云千帆平台、字节火山引擎、中国联通等平20台宣布将入局DeepSeek,促进“Al+”应用端全方位落地提速,带来“A+”多维落地进行时局面。2024/052024V082024/112025/02华为深度拥抱DeepSeek:根据华为云2025年2月1日官网微信一计算机-沪深300公众号,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云并腾云服务的DeepSeekR1N3推理服务。根据芯通社到NIDIA H1O0芯片的60%左右。更进一步地,通过手写CUNN邮箱:liuzj1@hx168.com.cn内核和优化,并腾910C的性能还可以进一步提升。我们判嘶异SACN0:S1120520020002腾910C在国产化推理时代更具性价比。联系电话:关注华为3月发布新品:Deepseek为本地化部署提供更多选择,目前本地化部署提供了6个蒸馏版本,端云协同成为必选项。在邮箱:menglrq@hx168.com.cn线模式和离线模式的推理平台有所不同,离线模式(端侧模型)SACN0:S1120524060001注重低延时和实施体验,而在线模式(云端模型)注重功能强联系电话:大。根据前瞻网,华为余承东在春节假期的直播活动中透露,今年3月将发布一款“别人想不到的产品”,而且价格亲民。根据数码博主爆料,华为新款折叠屏手机有望推出据悉,此外,建议关注华为纯血鸿蒙AIPC。我们判断以华为和DeepSeek为首的国产化生态正在加速繁荣,A1+终端商业化有望形成闭环。受益标的:请仔细阅读在本报告尾部的重要法律声明华西证券证券研究报告|行业动态报告风险提示1、政策不及预期的风险:2、A|伦理风险:3、技术升级不及预期的风险:4、中美贸易摩擦升级的风险。请仔细阅读在本报告尾部的重要法律声明2华西证券HUAXI SECURITIES证券研究报告|行业动态报告正文目录1.华为深度拥抱Deep Seek,国产化全面启航41.1.英伟达引领全球计算架构持续升级…1.2.关注华为三月发布新产品2.投资建议:153.风险提示…图表目录图表2几款主流模型的P价格对比.5图表4主流大模型能力对比.5图表5R1与其他开源模型对比效果评测.5图表6华为云发布DeepSeek的推理服务.6图表7云原生20全景图……图表8海光“光源”板块…图表11开悟大模型接入DeepSeek.11图表12华为小艺智能体.…12图表13目前本地化部署提供了6个蒸馏版本..13图表14端云协同模式…14图表15华为折叠屏手机概念图.15图表16华为1+8+W战略…15请仔细阅读在本报告尾部的重要法律声明3华西证券证券研究报告|行业动态报告HUAXI SECURITIES1.华为深度拥抱Deep Seek,国产化全面启航1.1.国产大模型Deep Seek震撼来袭DepS0k是一家中国人工智能公司,成立于2023年7月17日,总部位于浙江杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(LLM)及相关AI技术的研发。简单来说,DeepSeek是一款大语言模型(山M),主打“极致性价比”。它能写代码、解数学题、做自然语言推理,性能比肩0penA|的顶尖模型o1,但成本却低到离谱一训练费用仅557.6万美元,是GPT-4o的十分之一,P1调用成本更是只有OpenAl的三十分之一。图表1 DeepSeek开源模型时间轴20240105:20240311:20240617:20241213:20250120:DeepSeek LLMDeepSeek-VLDeepSeek-Coder-DeepSeek-VL2 DeepSeek-R1↓V220240205:20240507:20241017:20241226:20250127:DeepSeek-MathDeepSeek-V2DeepSeek-Janus DeepSeek-V3DeepSeek-JaPro资补来源:算法工程笔记,华西证券研究所低训练成本+高性他表现,使得DeepSeek-V3成为国产模型之星。DeepSeek~V3性能表现令人惊叹:不仅全面超越了Llama3.1405B,还能与GPT-4o、Claude3.5 Sonnet等顶尖闭源模型正面竞争。更令人瞩目的是,DeepSeek-V3的API价格仅为Claude3.5 Sonnet的1/15,堪称“性价比之王”。DeepSeek-V3的预训练阶段在不到两个月内完成,并花费了2664KGPU小时。加上119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的完整训练成本仅为2.788MGPU小时。假设H800GPU的租赁价格为每GPU小时2美元,总训练成本仅为5.576M美元。请仔细阅读在本报告尾部的重要法律声明华西证券HUAXI SECURITIES证券研究报告|行业动态报告图表2几款主流模型的API价格对比图表3 DeepSeek-V3的训练成本ModelInput (cache miss)OutputDeepSeek$0.27/M tokens$1.10/M tokensTraining Costs Pre-Training Context Extension Post-Training TotalClaude Haiku 3.5in H800 GPU Hours119K278K$0.25/M tokens$1.25/M tokensin USDClaude Sonnet 3.5$3/M tokens$15/M tokensGPT-4o$5/M tokens$15/M tokens资料来源:人工智能B面,华西证券研究所资补来源:人工智能B面,华西证券研究所DeepSeek-R1:首个开源、媲美OpenAl o1的推理大模型。DeepSeek-R1展现出了与OpenAl o1相当甚至在某些方面更优的性能。在MATH基准测试上,R1达到了77.5%的准确率,与o1的77.3%相近:在更具挑战性的A1ME2024上,R1的准确率达到71.3%,超过了o1的71.0%。在代码领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。DeepSeek-R1成功蒸馏出多个小型推理模型,其中32B&70B版本可媲美OpenAl o1mini。蒸馏后的小模型也取得了优异成绩,如DeepSeek-R1 Distil|-Qwen-7B在AIME2024上得分55.5%,超过QwQ-32B-Preview(参考P6)。图表4主流大模型能力对比图表5R1与其他开源模型对比效果评测0pesML-el-mlaiDeepseek-V3Sennet-1022 0513MMLU-Pro2CodeAider-Tolyglot160C-SimpleQA me华西证券研究所资料来源:算法工程师笔记,华西证券研究所国产De即Seek火爆,高桑群能力并非唯一解:根据新智元援引外蝶报道,他们在短短两个月时间,在2048个H800GPU集群上,训出6710亿参数的MoE语言模型,比顶尖A1效率高出10倍。华为深度拥抱Deep Seek,引领国产化液潮:根据华为云2025年2月1日官网微信公众号,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云并腾云服务的DeepSeekR1N3推理服务。该服务具备以下特点:得益于自研推理加速引擎加持,硅基流动和华为云开腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU请仔细阅读在本报告尾部的重要法律声明华西证券证券研究报告|行业动态报告HUAXI SECURITIES部署模型的效果。提供稳定的、生产级服务能力,让模型能够在大规模生产环境中稳定运行,并满足业务商用部署需求。华为云开腾云服务可以提供澎湃、弹性、充足的算力。图表6华为云发布DeepSeek的推理服务首发!硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务!华为云2025年02月01日12:58广东DeepSeek-R1开源后引发全球用户和开发者关注,经过硅基流动和华为云团人连日攻坚,现在,资料来源:华为云公众号,华西证券研究所据悉,华为云已经开启云原生2.0时代:进入华为云原生2.0时代,企业智能升级进入新阶段一一企业云化从“ON Cloud”走向“IN Cloud“。企业新生能力基于云原生构建,让应用、数据和A!全生命周期在云上完成。同时,既有能力通过立而不破的方式继承下来,并与新生能力有机协同。实现资源高效、极致体验、万物互联、应用敏捷、业务智能、数据融合、安全可信、行业使能八大业务价值,赋能企业成为新云原生企业。请仔细阅读在本报告尾部的重要法律声明6华西证券证券研究报告|行业动态报告HUAXI SECURITIES图表7云原生2.0全景图技术即服资料来源:华为云官网,华西证券研究所DeepSeek作为高性能A|大模型,训练和推理过程需要处理海量的数据和复杂的算法运算。例如,DeepSeek--V3模型拥有6710亿参数,在训练阶段需要进行大规模的矩阵运算,这依赖于强大的GPU/TPU等硬件加速器。同时,推理阶段也需要高效的算力支持,以确保快速响应用户请求。随着DeepSeek访问量持续上升,导致服务器需要同时处理大量请求。例如,DeepSeek应用上线20天,日活用户就突破2000万。在这种情况下,如果没有足够的算力支持,服务器将难以快速响应,导致用户使用体验不佳。国产服务器部署为DeepSeek的模型训练提供了强大的算力支持。同时也为DeepSeek的多模态大模型训练提供了高效的管理和调度环境。2月4日,海光信息宣布其技术团队近日成功完成DeepSeek V3模型、R1模型、Janus-Pro0多模态大模型与海光DCU的适配优化,并正式上线。DCU(深度计算单元)是海光信息推出的高性能GPGPU架构Al加速卡,DeepSeek模型可直接在DCU上运行,并不需要大量适配工作,技术团队的主要工作是进行精度验证和持续的性能优化。请仔细阅读在本报告尾部的重要法律声明华西证券证券研究报告|行业动态报告HUAXI SECURITIES图表8海光“光源”板块购DeepS6ek-Coder-V2代码生成方向大模型,支持33B种偏程语言2月6日,燧原科技宣布完成了对Dee即eek全量模型的高效适配,包括DeepSeek R1N3671B原生模型和蒸馏模型。目前,DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一成果标志着燧原科技在国内率先实现了DeepSeek全量模型的部署和落地。请仔细阅读在本报告尾部的重要法律声明华西证券证券研究报告|行业动态报告图表9燧原科技完成DeepSeek全量模型部署deepseek-chatdeepseek-coder-i..DeepSeek-R1DeepSeek-R1-Dist...DeepSeek-R1-Dist...*deepseek-v2-chatdeepseek-v2.512Kdeepseek-vl-chatgim-4vglm4-chatglm4-chat-1mon of pre-tined为了促进“AI+”应用端全方位落地提速。国内方面,华为云、腾讯云、阿里云、百度智能云千帆平台、字节火山引擎、中国联通宣布联通云宣布将入局DeepSeek,带来“AI+”多维落地进行时局面。请仔细阅读在本报告尾部的重要法律声明9华西证券证券研究报告|行业动态报告图表10 DeepSeek接入应用公司华为商。阿里云-R1型。随着DeepSeek的热度持续攀升,联想、钉钉等众多大厂纷纷推出基于DeepSeek大模型的一体机解决方案,企业智能化转型的算力与安全需求增大,迅速占领本地化部署市场。开普云则宣布在开悟大模型智能体平台接入DeepSeek V3、R1在线模型API,在运营管理平台部署量化版R1模型服务,在端侧一体机中部署蒸馏量化版R132B模型。同时,会针对政务、能源、内容安全、蝶体等关键行业,推出升级版端侧一体机产品。请仔细阅读在本报告尾部的重要法律声明10
文档评分
    请如实的对该文档进行评分
  • 0
发表评论

特惠

限量优惠活动

正在火热进行

站长

添加站长微信

领取运营礼包

下载

便携运营智库

立即下载APP

工具

运营工具导航

AI工具导航

帮助

帮助中心

常见问题

顶部