热门文档
- 2024-11-17 13:23:03 Mckinsey:2024中国消费趋势调研
- 2024-05-19 21:59:54 2024小红书餐饮行业方法论
- 2024-03-22 23:03:56 红爵啤酒品鉴会“红爵之夜 嗨啤TIME ”主题活动策划方案
- 2024-08-18 12:25:23 2024年科大讯飞1024招商方案
- 2024-07-09 21:55:15 如何运营你的小红书?
- 2024-09-08 21:00:26 【Short TV】ShortTV出海短剧内容生态
- 2024-11-04 20:41:56 淘天集团:2024年家装家居行业营销解决方案
- 2024-09-18 21:21:14 最美的夜bilibili晚会-招商方案
- 2024-10-20 11:10:26 企业新春年会盛典(跨越前行·进无止境主题)活动策划方案-
- 2024-08-25 22:28:04 喜马拉雅:喜马拉雅2024营销白皮书
- 2024-07-21 20:53:59 2024全球E-Bike市场洞察报告(电动自行车)
- 2024-09-01 17:42:02 龙井温泉度假区文旅项目营销运营提升升级策划案

1、本文档共计 20 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
专题报告Deepseeki引爆通信产业新机遇西南证券研究发展中心通信研究团队2025年2月www.swsc.com.cn核心要点DeepSeeki通过创新算法使推理效率大幅优化,大幅降低了应用成本。DeepSeek-V3的训练成本仅为2.788MH800GPU小时,同时其支持FP8混合精度训练,并针对训练框架进行了全面优化,以实现见心加速训练和降低GPU内存使用,通过算法、框和硬件的共同设计,克服了跨节点MoE训练中的通信瓶颈,显著提高了训练效率并降低了训练成本。DeepSeek每百万输入tokens成本为0.S5美元,每百万输出tokens成本为2.19美元,相较于ChatGPT O1模型,输入和输出成本均降低了96%。DeepSeek-V3采用了多头潜在注意力(Multi--head Latent Attention,MLA)和DeepSeekMoE架构,显著提高了推理速度和显存利用率,能够在保持模型性能的同时实现高效的训练和推理。DeepSeek/从成本端和技术端对垂类AI小模型(AI Agent)带来了直接催化。从成本端看,更低的推理成本降低了垂类AI Agent的开发成本,极大剩激了各行业的企业智能化需球。技术端看,Deepseek在自然语言理解、多模态交互等底层技术上的突破直接降低了垂直领域小模型的技术门槛,其开源的分布式训练框架等技术能被小模型复用。同时,Deepseek的模型知识蒸馏等压缩技术使小模型既能继承大模型能力,又保持轻量化特性。对数据实时性敏感的垂类Nāgt需要在感知端和云端快速传递数据,对低时延高带宽网络提出要求,同时小模型下沉到中小企业,进一步带来了网络通信基础设施需球,对交换机、边缘计算设备、5G切片等带来新需求。光模块等需求来源从训练韩转向推理,带来多场景适配需求。虽然单次训练任务的算力需求降低,但模型轻量化可能推动分布式训练和边计算的普及,导致数据中心内部短距连接需球从集中式超算集转向更分散的节点间通信。机架内光模块对于高密度计算仍需要低西迟、高带宽的互连,800G模块需求可能受分布式架构的推动;而在边缘场景,短距光模块在边缘服务器的部曙比例问能上升,但单点用量低于传统超算中心。同时,技术替代效应强于需求收缩,CPO的核心价值在于解决传统可插拔光模块的功耗和密度瓶颈,即使算力需求下降,但对于能效比要求、空间压缩腰求、降低成本要求仍可能图驱动其渗透率提升。●风险提示:AI建设不及预期:上游资本开支不及预期等。www.swsc.com.cn目录1技术突破开源大模型如何重塑AI Agent:开发范式2因果闭环一AI Agent多点开花和边缘设备搭载a如何倒逼通信升级3硬件变革—一通信产业链的确定性机会www.swsc.com.cnDeepSeek与开源模型的“降本增效”革命DeepSeek.大幅降低丁应用成本。DeepSeek--V3的训练成本仅为2.788W800GFU小时,同时其支特FP8混合精度训练,并针对训陈框架进行了全面优化,以实现加速训练和降低G内存使用,通过算法、框架和硬件的共同设计,克服了跨节点®E训练中的通信瓶颈,是显著提高了训练效率并降低了训练成本DeepSeek每百万输入tokens成本为0.55美元,每百万输出tokens成本为2.19美元,相较于ChatGPT01模型,输入和输出成本均降低了98%DeepSeek通过创算法使推效率大幅优化,DeepSeek-V3采用了多头潜在注意力(Multi--head Latent Attention,MA)和DeepSeekMoE架构,是著提高了推理速度和显存利用率,能够在保持模型性能的同时实现高效的训练推理。DeepSeek-R1与各类大模里性能比较DeepSeek-V3与各类大模型性能较DeegSeek-V3MitlE-nnUA-08www.swsc.com.cn3DeepSeek与开源模型的“降本增效”革命术,通过低秩联合压缩注意力键(Key)和值(a1ue),显著降低了推理过程中的V缓存,同时保持了标准多头注意力(HA)相当的性能。LA架构在保持模型性能的同时,通过压缩技术减少了内存占用和计算量,从面提高了模型的推理效率。任务或数据子集。在训练和推理过程中,只有部分专家被激活,从面减少了不必要的计算。E架构能够显降低计算开销,提高模型的训练和推理效率。此外,架构还具有高度的可扩展性,通过增加专家的数量,可以进一步提升模型的性能,面不会显著增加计算成本。MoE系数模型效率提升MLA架构带来的效率优化MLA架构带来的效率优化1产出需0.81产出0.3上下文理解单样本计算量3-10倍单层白注意力6-12个月先发优势澄价慎型容量机练显存占用全泰数存储机制140%生态价值+开发者生态3x层级相关位置长文本处理+15个百分点依赖英伟达生态www.swsc.com.cn目录1技术突破一开源大模型如何重塑AIAgent开发范式2因果闭环一AI Agent多点开花和边缘设备搭载ai如何倒逼通信升级3硬件变革一通信产业链的确定性机会www.swsc.com.cn垂直小模型多点开花DeepSeek,从成本墙和技术墙时垂类I小慎理(AI Agent)潜来了直赞化,从成本端看,DeepSeek推理成本大幅降低,DeepSeek每百万输入tokens成本为0.55美元,每百万输出tokens成本为2.19美元,相较于ChatGPT01模型,输入和输出成本均降低了g8%。更低的推理成本降低了垂类AI Agent的开发成本,极大刺激了各行业的企业智能化需求。技术端看,Deepseek在自然语言理解、多模态交互等底层技术上的突破直接降低了岳直领域小模型的量化特性。低了开发垂类模型的行业数据的需求和成本,形成“大模型增强-小模型易用性提升”的正向循环。各大模型tokens成本比较部分垂类大模型示意■Input零售■Output9汽车30GrokChatGPT-o131Googleamazonwww.swsc.com.cn6垂直小模型带来通信基础设施需求周围环境的大量数据,如路况、交通信号、其他车辆和行人的位置等,以便做出快速准确的决策。这要求5G网络的端到端时延必须小于20S,以确保数据的实时传输和处理。大量的散据处理也带来丁算力分布的重构。医疗影像领减需要处理大量的高分辨率图像数据,传统的集中式云计算模式在处理这些数据时存在延迟和带宽瓶颈,因此,边缘计算节点可以将部分计算任务从云端转移到靠近数据源的地方,从面减少数据传输的延迟,提高数据处理的效率。视频数据,任何网络中断或数据丢失都可能导致质检过程的中断,一般工业确定性网络的需要可用性达到的.9%,以实现数据的确定性传输。网络是大模型的重要基础能力车联网边缘计算示意面建设规划需求分析开发可评价能计算www.swsc.com.cn7网络架构革命驱动基础设施升级G情遇型蓝站爆发:边缘计算将数据处理和分析的能力从云端向网络边缘转移,常近数据源或用户增,G增强型基站作为5G网络的重要组成部分,其高速率、低时延、大连接的特性为边缘计算提供了强大的网路支持,使得边缘计算能够更好地发挥其优势。在边缘计算场景下,边缘I要求网络切片能力提升300%,A4U设备需支持动态算力分配,华为、中兴均已重点布局。计将在2028年达到3780亿美元,%的边缘计算设备应用于机器视觉臧,22%和12%的设备应用于设备控制监控和视频安防监控领域。同时,边缘计算算力需求也对设备的功耗和希提出了新要求,24年单台边缘服务器功率密度突破30kW/机架预计液希渗透率在未来三年内将从5%升至35%。各应用对于速率和时延需求分布边缘计算设备应用领域分布IDC用无人机●4G●公5Gwww.swsc.com.cn运营模式向算力服务转型需定制,满足不同业务需求。边缘计算车网路切片结合,可实现网络资源的灵活分配和管理。AI Agent可以按需调用切片资源,根据不同应用对网路带宽、时延的不同要求,利用网路切片技术,可为各应用创建专属切片,结合边缘计算的数据处理能力,实现生产过程的高效协同和优化。一算力交易平台:算力交易平台是连接算力供需双方的中介,提供算力资源的交易、调度和管理服务。它得分散的算力资源整合,形成算力资源池,根据用户需求进行灵活分配和调度。边缘计算的算力资源分布广泛且异构,算力交易平台可有效整合这些资源,提高资源利用率。网络切片示意图网络切片架构示意图6www.swsc.com.cn9
请如实的对该文档进行评分-
-
-
-
-
0 分