中信证券:看好DeepSeek新一代模型带动云端推理需求爆发 加速AI应用端侧落地
2025-02-23 04:55:56 Source:vszul Classification: XM软件
根据中信证券发布的中信证券研报,DeepSeek的看好工程创新使大模型训练和推理成本得到极大的优化,为高性能模型在端侧部署提供了新方向。新代需求XM市场动态通过分析DeepSeek V3和R1模型,模型其核心逻辑是动端侧"按需分配算力,最小化冗余计算",云端应用在低成本硬件上实现千亿级模型的推理高效运行,为商业化落地奠定了技术基础。加速预计DeepSeek新一代模型将推动云端推理需求激增,落地XM市场动态加速AI应用在端侧的中信证券实际应用。
中信证券主要观点
**DeepSeek训练成本降低方式:
1. **架构创新:** DeepSeek-V3采用了专家架构和多头注意力机制,看好通过优化传统MoE提高计算资源效率。新代需求
2. **FP8混合精度训练:** 全球首次采用FP8低精度数据进行训练,模型提升速度降低内存消耗。动端侧
3. **训练工程优化:** 采用硬盘作为输入端缓存,云端应用设计高效算法实现流水线并行,降低通信开销。
4. **数据策略优化:** 应用多token预测机制MTP,提升训练效率。
**DeepSeek推理成本降低方式:
**- 优化专家使用效率、支持低精度量化与模型压缩,减少显存占用。
- DeepSeek-R1发布后受到国内外芯片厂商积极响应和支持。
**AI芯片设计方向:**
- 通信和计算同等重要,降低精度和内存需求关键。
- 建议开发独立通信协处理器,提升计算精度,减少访存开销,统一通信接口。
**投资策略:**
- 看好DeepSeek带来的云端推理需求潜力,加速AI应用在端侧落地。
- 建议关注品牌厂商和SoC芯片厂商的发展机遇。
**风险因素:**
- 算力芯片供应链不确定性、产能供给风险、资本开支不及预期等。
以上是中信证券关于DeepSeek新一代模型的观点和投资建议。