热门文档
- 2024-11-17 13:23:03 Mckinsey:2024中国消费趋势调研
- 2024-05-19 21:59:54 2024小红书餐饮行业方法论
- 2024-03-22 23:03:56 红爵啤酒品鉴会“红爵之夜 嗨啤TIME ”主题活动策划方案
- 2024-08-18 12:25:23 2024年科大讯飞1024招商方案
- 2024-07-09 21:55:15 如何运营你的小红书?
- 2024-09-08 21:00:26 【Short TV】ShortTV出海短剧内容生态
- 2024-11-04 20:41:56 淘天集团:2024年家装家居行业营销解决方案
- 2024-09-18 21:21:14 最美的夜bilibili晚会-招商方案
- 2024-10-20 11:10:26 企业新春年会盛典(跨越前行·进无止境主题)活动策划方案-
- 2024-08-25 22:28:04 喜马拉雅:喜马拉雅2024营销白皮书
- 2024-07-21 20:53:59 2024全球E-Bike市场洞察报告(电动自行车)
- 2024-09-01 17:42:02 龙井温泉度假区文旅项目营销运营提升升级策划案

1、本文档共计 22 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
爱建证券AIJIAN SECURITIES行业研究/行业点评2025年02月19日适合投资人的DeepSeek分析报告行业及产业电子/人工智能转题报告(1)强于大市本期投资提示:■2025年1月20日,DeepSeek发布自研模型R1在全球科技行业引起的震动,被西方媒体一年内行业指数与沪深300指数对比走势:称为"DeepSeek Shock”。DeepSeek不仅在媒体圈迅速爆火,同样也成为了资本市场的.宠儿,其概念指数仅仅诞生10日后板块成交金额就超过了全部A股成交额的20%。这一切现象究其原因,是因为DeepSeek通过技术微创新,以更低的硬件成本和更短的时间实现了可以与市场领先产品竞争的能力。更重要的是,DeepSeek打破了行业"“限制中国企业对于最先进GPU获取,将能够阻止中国AI技术发展”的一贯认知。本文有别于市场上大部分研究报告冗长的技术细节描述,我们针对投资人短时间内客观理解DeepSeek的需求,加入了不同于市场的思考和量化的分析t比较。以下是报告的核心观点:DeepSeek的技术创新在那里?1)首创DeepSeekMoE架构,专门设计用于实现终极专家相关研究专业化。DeepSeekMoE通过降低激活参数比例,实现了训练效率3.6X的提升和训练吞吐量3.6X的提升,2)通过引入MLA机制,DeepSeek-V2实现了显著增强的性能,节省了42.5%的训练成本、减少了93.3%的KW缓存并将最大生成吞吐量提升至5.76倍。DeepSeek--V3实际开发成本几何?公司官宣正式训练成本为580万美元,但是并没有披露隐性成本,DeepSeek-V3是建立在前期模型基础上开发的,前期研发投入约为2000-3000万美元,其他数据获取成本和硬件折旧成本未披露,实验试错成本约为500万美元,因此预计实际总成本超过4000万美元。实际成本虽然高达公开口径成本的7倍左右,但是仍然相对Lama3-405B降低了约69%:相对于GPT-4o降低了95%。◆未来GPU算力需求会大幅下降吗?短期内云服务大厂资本开支持续处于上升通道,这是由于Scaling Law导致行业对于算力军备竞赛的恐慌性投资仍然存在。但是Scaling Law中,数据资源同样限制若模型性能的提升。根据EP0CHA1预测,到2028年人类生成的公共文本数据总有效库存量约为300 T toker将被全部耗尽。换句话说,在现有模型框架和数据资源供给下,2028年之后单纯算力提升将难以继续推动模型性能的升级。核心结论:■给予行业"强于大市”评级。随着DeepSeek的横空出世,低成本高性能的模型训练部署成为可能。我们预计接入DeepSeek API的细分领域推理服务商将会快速涌现,同时终端设备将会能够实现蒸小模型的本地部署能力,包括服务器,智能手机和智能驾驶系统都将会迎来新一轮的升级浪潮。我们看好以下细分板块在DeepSeek推动下的未来发展:证券分析师>先进算力芯片制造产业链:算力芯片设计,先进制程晶圆代工,先进封等等。许亮专业咨询服务:包括A+医疗,法律,金融,会计,教育,政务等咨询服务领域。S08205250100022C智能终端:A1+智能手机,智驾汽车等终端产业链。0755-83562506xuliang@ajzq.com2B本地部署设备:服务器OEM及产业链。联系人■风险提示:大模型开发进度缓慢,模型升级不及预期。A1行业应用落地迟缓,商业模式难以实现良性循环。贸易摩擦加剧,先进芯片及半导体技术受限。行业研究2025年02月19日目录1.DeepSeek从何而来1.1 DeepSeek公司诞生1.2 DeepSeek里程碑事件…1.3 DeepSeek的爆火2.深入剖析DeepSeek.2.1 DeepSeek为什么被称为shock?82.2 DeepSeek的技术创新在那里?112.3技术细节之外的信心提升…3.市场对于DeepSeek最关心的问题3.1 DeepSeek-V3的模型实际成本几何?153.2GPU为代表的算力需求是否会大幅下降?164.DeepSeek对产业发展的影响195.风险提示.20清仔细阅读在本报告尾部的重要法律声明A行业研究2025年02月19日图表目录图1:DeepSeek里程碑事件…4图2:DeepSeek-R1发布后话题爆火…图3:DeepSeek概念占A股成交额比例超过20%.…5图4:DeepSeek通用模型V3性能达到行业领先水平图5:DeepSeek通用模型V3成本优势明显…9图6:DeepSeek推理模型R1性能达到行业领先水平.9图7:DeepSeek-R1价格优势明显..10图8:DeepSeekMOE架构可以用更少的训练参数实现更好的性能表现11图9:DeepSeek-V2通过MA机制实现了性能优势和成本降低.12图10:Scaling Law中算力与Al能力的关系….13图11:DeepSeek带动中国资本市场信心提升…图12:美国主要互联网企业资本支出金额(亿美元)图13:人类生成的公共文本数据将在2028年耗尽17图14:OpenAl模型参数规模快速靠近公共文本数据上限18表1:DeepSeek-V3和DeepSeek-R1比较.…8表2:DeepSeek--R1蒸馏小模型本地化部署10表3:DeepSeekMoE的效率创新表4:国内外高端GPU芯片性能比较表5:DeepSeek开发具备成本优势.表6:DeepSeek-V3正式训练阶段成本拆分15表7:DeepSeek-V3隐性成本拆分15表8:DeepSeek-V3实际成本对比表9:主要细分行业模型参数规模18清仔细阅读在本报告尾部的重要法律声明A行业研究2025年02月19日1.DeepSeek从何而来1.1 DeepSeek公司诞生2023年7月,DeepSeek公司由幻方量化创始人梁文锋主导创立,其团队依托幻方投资的资金与"萤火超算”万卡级算力资源(万张A100GPU),致力于AG1技术探索。2023年7月17日,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)正式注册,定位为技术驱动的开源A1公司。1.2 DeepSeek里程碑事件DeepSeek整个发展历程可以分为五个阶段:阶段一:2023年11月,DeepSeek代码模型首透,主要包括:DeepSeek Coder:首个开源代码大模型,支持多语言生成与调试,且性能超越CodeLlama,奠定了技术口碑。DeepSeek LLM67B:通用大模型开源,对标LLaMA270B,中英文任务表现领先。阶段二:2024年1月-5月,DeepSeek实现了MoE架构创新。发布DeepSeekMoE国内首个开源MoE模型,采用细粒度专家共享架构。DeepSeek-V2第二代MoE模型,引入MA(多头潜在注意力)技术,推理成本仅为LaMA3的1/4,API定价低至GPT-4 Turbo的1/70,大幅拉低A使用成本。图1:DeepSeek里程碑事件2024.1-5MoE架构创新DeepSeek-V22024.6-82023.11deepseek coderdeepseek LLM 6782025.12024.12资料来源:DeepSeek,爱建证券研究所清仔细阅读在本报告尾部的重要法律声明A行业研究2025年02月19日阶段三:2024年6-8月,多领域拓展与性能跃升。DeepSeek发布垂直领域模型DeepSeek Coder V2(2024年6月):代码能力超越GPpT-4 Turbo。DeepSeek-Prover--V1.5(2024年8月):数学推理模型,覆盖初等数学至研究生水平。阶段四:2024年12月,实现通用模型的迭代。DeepSeek--V3发布,公司宣称训练成本仅550万美元,性能对标国际闭源模型,生成速度提升3倍。DeepSeek-.VL2(2024年12月):多模态MoE模型,视觉能力显著提升.阶段五:2025年1月20日,DeepSeek正式发布第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。1.3 DeepSeek的爆火随着DeepSeek-R1发布,相关话题在媒体网络爆火,微信指数迅速超越ChatGPT。2025年2月5日,DeepSeek同样也成为了资本市场的宠儿。DeepSeek概念指数仅仅诞生10日后,2025年2月14日DeepSeek板块成交金额就超过了全部A股成交额的20%。同时期内,沪深300指数张幅约为3.8%,DeepSeek成为了这一轮市场上张的重要推动力量。图2:DeepSeek-R1发布后话题爆火图3:DeepSeek概念占A股成交额比例超过20%25.00025%近7天近30天20.000209%●deepseek●chatgpt15.00010.0005.0002501/152501202501/2325/0205250210250213资料来源:微信指数,爱建证券研究所资料来源:Find,爱建证券研究所除了在媒体和资本市场的火爆,DeepSeek是国内首个获得各行各业认可并实际接入的大模型。具体来看,目前已经接入DeepSeek的已经包括云服务领域,网络安全领域,办公&教育,医疗,政务等等行业的多家国内外知名企业。■云服务领域华为云:2月1日,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek推理服务,让模型能够在大规模生产环境中稳定运行。腾讯云:2月2日宣布在高性能应用服务"HA上支持一键部署DeepSeek-R1模型,开发者仅需3分钟即可接入调用,阿里云:2月3日宣布阿里云P4 I Model Gallery支持云上一键部署DeepSeek-.V3、DeepSeek-R1。百度智能云:2月3日宣布清仔细阅读在本报告尾部的重要法律声明行业研究2025年02月19日DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架,并推出了超低价格方案。京东云:2月4日宣布正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。联通云:2月3日宣布联通云已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型。天翼云:2月6日,电信天翼云自主研发的“息壤“智算平台率先完成国产算力与DeepSeek-R1N3系列大模型的深度适配优化。火山引擎:支持V3/R等不同尺寸的DeepSeek开源模型,提供高性能推理服务。■网络安全领域360集团:2月2日宣布其安全大模型正式接入DeepSeek,将以DeepSeek为安全大模型基座,训练出“DeepSeek版”安全大模型。安恒信息:2月4日发布信息称,旗下恒脑·安全垂域大模型正式集成DeepSeek,完成基于DeepSeek-R1的安全大模型的训练。奇安信:2月5日宣布自主研发的QAX安全大模型已全面完成了DeepSeek的深度接入。亚信安全:2月5日宣布基于DeepSeek-V3/R1构建智能体,能够在海量的安全告警中,快速、低成本地挖掘到不同来源、不同类型安全告警中的关联关系。安博通:2月7日,安博通下一代Al防火墙与人工智能大模型强强联合,搭载DeepSeek-R1-Distil-Qwen-32B模型。■办公&教育领域视觉中国:完成DeepSeek-R1接入与本地化部署,并在多个产品中深度应用其能力。钉钉:钉钉Al助理接入DeepSeek,.支持深度思考。用友:通过引入DeepSeek进一步优化YonSuite的Al能力,并将以更多数据开源模型训练YonGPT模型。飞书:飞书多为表格、飞书智能伙伴已接入DeepSeek。ima:正式接入DeepSeek-R1模型,在使用搜、读、写和知识库的时候,可以选择腾讯混元大模型或DeepSeek--R1模型。网易有道:全面接入DeepSeek-R1,Al全科学习助手“有道小p”结合DeepSeek--R1超长思维链所提供的思考及分析能力,进一步优化了个性化答疑功能。云学堂:已全面接入DeepSeek-R1W3大模型,云学堂的AI制课专家、AI学习地图、AI学习专家、N对练等产品均能够使用包括DeepSeek在内的多种大模型能力。万兴科技:已完成与DeepSeek最新推理大模型DeepSeek-R1的深度适配,旗下产品如万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等均已集成该模型。知乎:DeepSeek-R1模型能力已经在知乎直答网页和知乎A即p双端集成上线,实现了搜索结果和解答质量的全面提升。科大讯飞:讯飞开放平台宣布DeepSeek全系大模型现已正式上线,支持公有云API调用和专属模型一键部署。清仔细阅读在本报告尾部的重要法律声明A行业研究2025年02月19日■政务,医疗等其他深圳全面启用DeepSeek打造智慧政务新体验:2月16日,深圳市基于政务云环境面向全市各区各部门正式提供DeepSeek模型应用服务,实现了基于DeepSeek的人工智能政务应用一体化赋能升级。此前,深圳已于2月10日完成DeepSeek-R1(671B)满血版模型在政务云上的部署,并于2月13日组织开展全市使用操作培训,成为全省首个基于政务云信创环境下全市范围部署应用DeepSeek的城市。据“北京海淀”微信公众号2月11日消息,海淀区正式为区内企业提供DeepSeek全量模型服务,为辖区内行业提供大模型开发、大模型推理API服务、大模型应用开发服务等。浙江省卫健委和蚂蚁集团联合推出安诊儿”:2月16日,由浙江省卫健委和蚂蚁集团联合推出的“安诊儿”宣布融合DeepSeek-R1,升级大模型底座能力,多家医疗企业接入DeepSeek:2月6日,智云健康宣布将DeepSeek-R1模型接入公司自研医疗人工智能系统“智云大脑”。2月7日,医渡科技宣布,已将DeepSeek人工智能模型整合至公司自主研发的al医疗大脑”YiduCore。2月7日,鹰瞳Airdoc自主研发的万语医疗大模型完成焕新升级,接入DeepSeek R1模型。■海外知名企业微软已将DeepSeek-R1模型纳入其Azure Al Foundry,这标志着Al经济格局的重大转变。这一整合不仅挑战了现有的A!服务定价,还使更多企业能够以更低的成本采用Al技术。英伟达支持DeepSeek:.作为国际巨头之一,英伟达已正式宣布支持DeepSeek模型服务。英特尔支持DeepSeek:英特尔是另一家正式宣布支持DeepSeek模型服务的国际巨头。清仔细阅读在本报告尾部的重要法律声明A行业研究2025年02月19日2.深入剖析DeepSeek2.1 DeepSeek为什么被称为shock?DeepSeek近期在全球科技行业引起的震动,被西方媒体称为"DeepSeekShock”。这不仅造成了研究人员的兴奋,也引起了资本市场的高度关注。究其原因,是因为DeepSeek以更低的硬件成本和更短的时间实现了可以与OpenAl和Anthropic等美国公司的尖端产品竞争的能力。具体来讲,引起轰动的产品主要是通用大模型V3和推理大模型R1。表1:DeepSeek-V3和DeepSeek-R1比较特性DeepSeek V3DeepSeek R1架构混合专家(MoE)混合专家(MoE),优化推理能力参数规模671B671B每次仅激活37B参数计算优化大幅节省计算资源并提高响应速采用动态门控机制,适应推理任务应用场景自然语言处理NLP复杂逻辑推理特色由于其优秀的性价比,适用于实时可以蒸馏出参数规模不同的开源变化的商业和研究需求小模型,可以迅速部曙在不同应用场景的深度推理资料来源:DeepSeek,爱建证券研究所通用大模型DeepSeek-V3DeepSeek V3采用混合专家(MoE)架构,主要面向自然语言处理(NLP)任务,旨在提供高效、可扩展的解决方案。其优势在于高效的多模态处理能力(文本、图像、音频、视频)和较低的训练成本。图4:DeepSeek通用模里V3性能达到行业领先水平100资料来源:DeepSeek,爱建证券研究所清仔细阅读在本报告尾部的重要法律声明A行业研究2025年02月19日DeepSeek-v3在实现领先性能的同时,还保证了更加经济的训练成本。图5:DeepSeek通用模里V3成本体优势明显DeepSeek-V3Claude 3.5 Sonnet.Gemini 1.5 ProLlama-3.1-405B-Instruct.Qwen2.5-72B-Instruct.GLM-4-PlusMistral-Large-2411.Llama-3.1-70B-InstructDeepSeek-V2.5.ERNIE 4.0 'Turbo00资料来源:DeepSeek,爱建证券研究所■推理大模型DeepSeek-R1DeepSeek-R1:专注于复杂推理任务设计,强化在数学、代码生成和逻辑推理领域的性能。通过大规模强化学习(RL和冷启动技术,R1在无需大量监督微调(SFT)的情况下,实现了与OpenAl O1系列相当的推理能力。图6:DeepSeek推理模里R1性能达到行业领先水平DeepSeek-R1 OpenAl-01-1217DeepSeek-R1-32BOpenAI-o1-mini DeepSeek-V3AM里2024MATH-500Figure 1|Benchmark performance of DeepSeek-R1.资料来源:DeepSeek,爱建证券研究所DeepSeek R1属于性能与成本平衡的中小规模模型(7B参数)。训练成本主要涵盖算力(如GU集群)、数据准备、算法调优等核心环节。相较于清仔细阅读在本报告尾部的重要法律声明行业研究2025年02月19日千亿参数模型的数千万甚至上亿美元成本(如GPT-3估算约1200万美元),DeepSeek R1的设计更注重实际落地效率。这也使得DeepSeek-R1目前的API服务价格也远低于行业水平。图7:DeepSeek-R1价格优势明显o1类推理模型输入输出价格(元/1 M Tokens)DeepSeek-R1o1-mini■ol-preview11011016输入AP价格(缓存命中)资料来源:DeepSeek,爱建证券研究所同时让行业兴奋的是,基于DeepSeek--R1蒸馏出的开源小模型,可以适配于不同的应用环境,这让本地化部署的浪潮迅速展开。通过参数与场景的精准匹配,DeepSeek R1蒸馏模型可最大化性价比,覆盖从嵌入式设备到企业级服务的全场景需求。表2:DeepSeek-R1蒸馏小模里本地化部署参数规模0.1-0.5B0.5-1B1-3B3-7B核心优势超低功耗、平衡轻量化与基础支持中等复杂度生接近原模型能力,毫秒级响应语义理解成任务高效推理主要限制仅支持简单任务、输出质量中等,短文本处理推理可控性弱长文本生成不连贯显存需求较高(需GPU加速)手机/嵌入式芯片树莓派/边缘计算盒低端GPU或CPU服适用硬件中端GPU(如(Cortex-M)(4GB RAM)务器(8 GB RAM)T4/A10)任务复杂度单一分类/检测简单生成+分类多轮对话/摘要长文本生成/推理硬件成本<$50/设备$100-$300$500-$2000$3000+开发周期1-3天1-2周2-4周4-8周适用行业智能家居、零售客服、金融合规、农业传感器教育工具电信运维医疗、法律、营销资料来源:DeepSeek,爱建证券研究所清仔细阅读在本报告尾部的重要法律声明10
请如实的对该文档进行评分-
-
-
-
-
0 分