科技行研专题教材
专题教材

光模块专题教材 v0.3

从零理解 AI 数据中心里的高速光互联:先需求、再网络、再产品、再BOM、再制造、再路线、再公司。

日期:2026-06-27

状态:专题教材第三版,逐模块详解版。旧的“全科技系统教材”先搁置,本文件作为新的专题教材样板。目标不是先给投资结论,而是让一个电子行业初学者能顺着读懂:光模块是什么、为什么AI数据中心需要它、产业链怎么拆、技术路线为什么有分歧、哪些节点可能是真瓶颈、公司应该怎么映射、哪些数据还缺。

本版相对 v0.2 的增量:把原来的框架继续扩写成八个可反复阅读的学习模块:需求、网络、产品、BOM、制造、路线、公司、数据。每个模块都按“是什么、为什么难、怎么分析、常见误区、数据缺口”展开,便于直接作为专题教材使用。可视化入口见 ..\..\visualizations\optical_module_industry.html

0. 本专题先解决什么

光模块是AI基础设施里最容易被误读的环节之一。市场常把它讲成“800G、1.6T、CPO、硅光、LPO、NPO”这些名词的竞赛,但初学者真正需要先弄清楚三件事:

  1. 光模块在系统里做什么。
  2. AI服务器和交换机为什么把光模块推到核心位置。
  3. 技术路线变化会改变哪些产业节点,哪些节点又可能不受路线影响。

这版教材采用“先系统、再产品、再BOM、再路线、再公司”的顺序。投资材料只作为线索,不作为内容边界。

1. 一句话理解光模块

光模块是把电信号和光信号互相转换的高速接口。

在数据中心里,GPU服务器、交换机、网卡之间需要传输海量数据。芯片内部处理的是电信号,但长距离、高带宽传输更适合用光纤和光信号。光模块插在交换机或服务器端口上,把设备里的高速电信号转换成光信号,通过光纤发出去;另一端的光模块再把光信号转换回电信号。

可以先把它想成一个“高速翻译器”:

设备里的电信号 -> 光模块发射端 -> 光纤传输 -> 光模块接收端 -> 设备里的电信号

如果没有这个翻译器,AI集群里的GPU、交换机、存储和服务器就很难用足够高的带宽连接起来。

2. 为什么AI数据中心拉动光模块

传统数据中心也需要光模块,但AI数据中心把问题放大了。

普通互联网业务更多是用户访问网页、视频、数据库,流量主要在服务器和外部网络之间流动。AI训练和推理不一样,它要求大量GPU、CPU、内存、存储和交换机在集群内部高频交换数据。模型越大、集群越大、并行度越高,网络带宽、延迟和稳定性越重要。

AI基础设施对光模块的拉动来自三层:

  1. 集群规模变大:GPU数量增加,交换机端口和链路数量增加。
  2. 速率升级:从100G、200G、400G走向800G、1.6T,单端口带宽提升。
  3. 网络结构变化:scale-out、scale-up、液冷、电力约束、交换架构变化,都会影响光模块数量、形态和上游部件。

这里要先区分两个词:

场景含义对光模块的启发
Scale-out多台服务器、多台交换机之间横向扩展需要大量可插拔光模块、光纤、连接器和交换机端口
Scale-up同一计算域内更紧密、更低延迟互联可能催生NPO、CPO、光引擎、更多短距高密度光互联

很多争论来自把这两个场景混在一起。可插拔光模块、LPO、NPO、CPO不是简单的“谁消灭谁”,而是不同场景、不同时间、不同客户架构下的选择。

3. 光模块在系统里的位置

先画一条系统链:

AI应用/模型
-> 云厂商资本开支
-> GPU/ASIC服务器
-> 网卡/交换机/网络拓扑
-> 光模块/铜缆/AOC
-> 光纤/连接器/机柜布线
-> 上游光芯片、DSP、驱动、TIA、FAU、MPO、封装测试

这条链的关键不是“AI需求大,所以所有光通信公司都好”,而是要追问:

  • 需求落在哪种网络:以太网、InfiniBand、专有互联,还是混合架构?
  • 端口速率是什么:400G、800G、1.6T,还是更高?
  • 传输距离是什么:机柜内、机柜间、数据中心内、数据中心间?
  • 采用什么形态:可插拔模块、AOC、铜缆、LPO、NPO、CPO?
  • 瓶颈在哪里:光源、DSP、光器件、连接器、良率、测试、热管理、客户认证?

4. 光模块内部拆解

光模块不是一个单一零件,而是一组光、电、热、机械和软件的组合。

内部部分作用为什么重要
电接口和交换机/网卡端口连接,接收高速电信号端口速率提升后,信号完整性和功耗压力上升
DSP/Retimer对高速信号进行均衡、纠错、重定时等处理传统高端模块的关键芯片之一,也带来功耗和成本
驱动器/调制器驱动激光器或调制光信号影响带宽、功耗、线性度和可靠性
光源/激光器产生光信号,常见路线包括EML、CW激光器、VCSEL等800G/1.6T阶段常被讨论为供给瓶颈
探测器/TIA接收光信号并转成电信号接收端灵敏度、噪声和带宽影响链路质量
硅光/PIC把部分光学功能集成到芯片上可能降低封装复杂度和功耗,但依赖光源、耦合、良率
FAU/透镜/滤波器光纤阵列、耦合和无源光学处理高密度光互联下对准精度和良率很关键
MPO/LC/SN等连接器光纤连接和布线接口光纤数量增加后,连接可靠性和密度变重要
壳体/散热控制模块温度和机械稳定性1.6T模块功耗提高,散热成为系统约束
固件/监控诊断、管理、兼容和可靠性监控大客户认证和长期运行依赖可管理性

初学者读光模块公司时,不要只看“有没有800G/1.6T产品”。更重要的是看它到底掌握哪个环节:模块集成、光芯片、DSP、硅光、光器件、连接器、封装测试,还是只是做低速或电信侧产品。

5. 速率和形态怎么理解

光模块速率不是凭空升级,而是跟交换芯片、网络架构和电接口一起升级。

速率常见理解关键变化
400GAI早期和传统云升级的重要阶段100G/lane或更早架构逐步成熟
800G当前AI数据中心主线之一8x100G或4x200G,模块功耗、光源、DSP和良率压力上升
1.6T下一阶段高带宽主线8x200G或16x100G,200G/lane、散热、测试和供应链更难
3.2T及以后远期方向需要更高集成、更低功耗和系统级架构变化

形态也要分清:

形态简单解释研究重点
QSFP-DD常见可插拔形态之一密度、散热、兼容性、客户生态
OSFPAI数据中心常见高功耗可插拔形态800G/1.6T支持能力、散热、系统匹配
OSFP-XD更高密度形态探索是否进入主流客户架构仍需跟踪
AOC光模块和光纤一体化线缆短距、部署便利性、成本
DAC/AEC/ACC铜缆或有源铜缆机柜内短距可能替代部分光模块

6. 传输距离和光源路线

光模块不只按速率分类,也按传输距离分类。距离不同,技术路线会不同。

距离/场景常见方案产业含义
机柜内短距铜缆、AEC、AOC、短距光模块成本、功耗和布线便利性重要
机柜间/数据中心内800G/1.6T DR/FR等单模方案高速光模块、光源、DSP、连接器需求强
数据中心间相干光、长距传输与短距数通光模块不是同一套逻辑

常见光源路线:

路线基本含义优点风险/难点
VCSEL多用于短距多模场景成本和功耗优势距离和带宽上限受限
EML电吸收调制激光器,高速数通常见高速、长距离能力强InP工艺、产能、良率、成本和供应紧张
CW激光器 + 硅光外置连续波光源配合硅光调制有利于高集成和部分低功耗方案光源功率、耦合、硅光良率、供应链成熟度
相干光复杂调制和长距离传输适合DCI/城域/长距与AI集群短距互联不能简单混看

这里的核心教材结论是:不要把“硅光”理解为完全绕开光源。硅光改变的是集成和调制方式,但仍然需要高可靠光源、耦合、封装和测试。

7. 五条技术路线的关系

光模块专题最容易被“终局路线”带偏。第一版教材不押单一路线,而是按场景理解。

路线它想解决什么可能适用场景需要跟踪什么
传统可插拔DSP模块兼容性强、生态成熟、链路能力稳定scale-out网络、主流交换机端口800G/1.6T需求、DSP供应、模块功耗、ASP
LPO/LRO/TRO减少或部分减少模块侧DSP,降低功耗和成本受控环境、短距、高度优化的数据中心主机侧能力、互通性、客户认证、故障定位
硅光可插拔用硅光平台提高集成度和潜在成本效率DR/FR等高速数通场景CW光源、耦合、良率、量产和客户导入
NPO光引擎靠近交换芯片但仍保留一定可维护性更高带宽密度、更低功耗需求交换芯片平台、封装、散热、可维护性
CPO光学和交换芯片共封装,追求系统级低功耗未来scale-up或极高密度交换生态成熟度、维修替换、良率、标准、客户采用时间

本地材料里反复出现的一个有效提醒是:路线之争不能替代产业拓扑。与其猜“哪条路线一定赢”,不如找不同路线都绕不开的节点,例如高功率光源、部分光芯片、FAU、MPO/高密度连接、测试和封装能力。

8. 产业拓扑

下游需求:
  AI训练/推理 -> 云厂商Capex -> GPU/ASIC集群 -> 交换机/网卡/网络拓扑

系统层:
  GPU服务器 / AI加速卡 / 交换机 / NIC / DPU / 机柜布线 / 数据中心网络

光互联形态:
  可插拔光模块 / AOC / LPO-LRO-TRO / NPO / CPO / OCS

模块与组件:
  800G/1.6T光模块 / 光引擎 / 硅光模块 / 相干模块 / 连接器组件

核心半导体:
  DSP / Driver / TIA / CDR / 光芯片 / 硅光PIC / 调制器 / 探测器

光学与无源器件:
  EML / CW激光器 / VCSEL / FAU / 透镜阵列 / 滤波片 / WDM / MPO / LC / SN

材料与制造:
  InP衬底 / SOI衬底 / 光纤玻璃 / 陶瓷插芯 / 精密加工 / 耦合封装 / 测试设备

客户与认证:
  云厂商 / 交换机厂 / 服务器厂 / 网络设备厂 / 模块厂互供 / 代工厂

9. 节点研究

9.1 模块集成厂

模块集成厂负责把光芯片、DSP、驱动、TIA、无源光学、连接器、壳体、固件和测试整合成客户可用的光模块。它的壁垒不是“会装”,而是高速产品设计、物料管控、良率、可靠性、客户认证和大批量交付。

研究重点:

  • 是否具备800G和1.6T产品线。
  • 是否覆盖EML和硅光路线。
  • 关键物料是否受制于外部供应。
  • 是否进入头部云厂商/网络设备厂供应链。
  • 收入是否真的来自高端数通,而不是低速电信或传统产品。

9.2 光芯片和光源

光源是光模块的发射起点。EML、CW激光器、VCSEL、DFB等对应不同速率和距离场景。AI数据中心拉动800G/1.6T时,市场常讨论EML和CW激光器的供给瓶颈。

研究重点:

  • 100G/lane、200G/lane产品进展。
  • InP工艺能力、良率、可靠性。
  • CW光源是否进入硅光模块供应链。
  • 客户认证和批量出货,不只看样品。
  • 国产厂商是电信侧产品为主,还是已经进入高端数通。

9.3 DSP、Driver、TIA等电芯片

传统可插拔高端光模块通常需要DSP处理高速信号。DSP决定性能,也增加成本和功耗。LPO/LRO/TRO等路线的核心变化之一,就是试图减少或改变DSP的位置和功能。

研究重点:

  • 800G/1.6T DSP供应格局。
  • 200G/lane电接口进度。
  • DSP是否被LPO/NPO/CPO部分替代。
  • 模块厂能否拿到足够DSP供应。
  • Driver/TIA等模拟芯片是否有国产替代机会。

9.4 FAU、MPO和无源光器件

FAU是光纤阵列单元,用来把多根光纤高精度排列并与光芯片或光引擎耦合。MPO是高密度多芯光纤连接器。速率提升和光纤数量增加后,这些无源器件不再只是普通配件,而可能成为高精密制造节点。

研究重点:

  • 对准精度、良率、自动化能力。
  • CPO/NPO/硅光路线下的用量变化。
  • 是否路线无关:不管可插拔、硅光、NPO、CPO,光纤耦合和连接通常都绕不开。
  • 专利、客户认证和大批量交付。

9.5 硅光与衬底

硅光把部分光学功能集成到硅基平台上,理论上有利于集成度、规模制造和功耗优化。但硅光不是万能答案,它仍然依赖CW光源、耦合封装、测试、热管理和客户生态。

研究重点:

  • 硅光PIC量产能力。
  • CW光源供应和功率稳定性。
  • SOI衬底质量和供应。
  • 与传统EML方案的成本、功耗、良率比较。
  • 是否进入真实客户订单。

9.6 光纤、连接和布线

AI集群用到大量光纤和连接器,但光纤公司不一定自动成为光模块主线核心。光纤是必要基础设施,和高端光模块的价值捕获不在同一层。

研究重点:

  • 光纤总量和数据中心内部布线需求。
  • 多芯连接器、预端接、MPO/MTP组件的价值量。
  • 普通通信光纤扩产是否会压价格。
  • 公司业务是否只是传统光缆,还是有数据中心高密度连接能力。

10. 公司映射的正确顺序

不要先列股票池。先把公司放进产业角色。

角色判断标准示例方向
核心模块厂高速数通模块、客户认证、规模交付800G/1.6T模块厂
上游光源/光芯片EML/CW/VCSEL等核心器件InP光芯片、CW光源
DSP/电芯片800G/1.6T信号处理PAM4 DSP、Driver、TIA
无源光器件FAU、MPO、透镜、WDM等高精密耦合和连接
设备与测试高速测试、耦合、封装自动化224G/200G lane测试
系统/客户GPU、交换机、云厂商决定规格和采购节奏
边缘相关光纤、普通连接器、传统电信模块需要证明高端数通暴露
负面覆盖只有概念,没有产品/客户/份额只保留复查条件

11. 常见误判

  1. 把CPO当作短期替代全部可插拔模块的结论。
  2. 把硅光当作彻底绕开光源和封装的路线。
  3. 把普通光纤、普通连接器、传统电信光模块直接映射到AI数据中心高端光模块。
  4. 只看速率名词,不看传输距离、形态、客户和认证。
  5. 只看公司是否发布样品,不看是否量产、良率、交付和收入。
  6. 把模块厂、光源厂、无源器件厂、DSP厂放进同一个估值逻辑。
  7. 把海外客户Capex直接等同于每一家A股公司收入。
  8. 用股价排序反推产业地位。

12. 本版研究假设

假设当前等级说明还缺什么
AI数据中心推动800G/1.6T光模块需求升级L2/L3公开产品、标准路线和客户Capex方向都支持高速光互联升级800G/1.6T真实出货量、ASP、客户结构
可插拔模块仍是短中期主线,但NPO/CPO值得作为后续路线跟踪L2OSFP/QSFP-DD生态成熟,CPO/NPO仍处于客户导入和生态建设阶段头部客户时间表、真实采购、维修和良率数据
EML/CW光源、DSP、FAU/MPO可能是关键瓶颈L1/L2本地材料和公开产品资料均指向高端器件重要性供应份额、产能、价格、客户认证
硅光是重要路线,但不是“无光源路线”L2硅光仍依赖CW光源、耦合和封装各厂量产良率和成本对比
光模块不是一个统一Beta行业,节点之间分化会很大L1/L2模块、光源、DSP、无源器件、光纤的价值捕获不同公司收入纯度和产品结构

13. 数据缺口优先级

P0缺口:

  • 800G、1.6T光模块全球出货量、ASP和产品结构。
  • 头部云厂商/网络设备厂对可插拔、LPO、NPO、CPO的采用时间表。
  • EML、CW光源、DSP、FAU/MPO的供需和供应商份额。
  • A股公司高端数通收入纯度、客户认证和出货等级。

P1缺口:

  • 200G/lane方案良率、功耗、散热和测试成本。
  • 模块厂物料管控能力和关键物料来源。
  • 硅光方案与EML方案的成本、功耗和可靠性对比。
  • CPO/NPO方案的维修、标准、生态和商业模式。

P2缺口:

  • 光纤/连接器/布线价值量。
  • OCS与光模块需求之间的替代或增量关系。
  • 国内算力与海外算力对光模块规格的差异。

14. 参考资料

本版主要使用本地材料作为研究线索,并用公开资料校验技术和产品口径。

本地线索:

  • F:\投资知识库\20_reference_frameworks\douyin_touzhijunjun\frameworks\versions\2026-05-12_v0.1.md
  • F:\投资知识库\30_archive_text\douyin_touzhijunjun\2026\2026-06-16_别跟大佬盘CPO了,买方简单题都赚完了,抄作业就行_7651891863795944767\summary.md
  • F:\投资知识库\30_archive_text\douyin_touzhijunjun\2026\2026-06-04_光模块,职业买方为啥从来不单票梭哈?_7647484071781748018\summary.md

公开资料:

  • Ethernet Alliance 2025 Roadmap/OFC信息:https://ethernetalliance.org/blog/2025/03/17/ethernet-alliance-showcases-future-ready-ethernet-innovation-at-ofc-2025/
  • OSFP MSA说明:https://osfpmsa.org/
  • OIF当前工作说明:https://www.oiforum.com/technical-work/current-work/
  • LPO MSA FAQ:https://www.lpo-msa.org/home/faqs.html
  • Marvell PAM4 DSP产品页:https://www.marvell.com/products/pam-dsp.html
  • Coherent 1.6T-DR8 OSFP产品页:https://www.coherent.com/networking/transceivers/datacom/FTCF2519E3PCA
  • 中际旭创产品页:https://products.zj-innolight.com/
  • 新易盛产品页:https://www.eoptolink.com/
  • 天孚通信产品与服务页:https://www.tfcsz.com/product_service.html
  • 光迅科技OFC 2024新品信息:https://www.accelink.com/lighting_your_dreams/1773182305532170242.html

15. 下一步

  1. 把标的覆盖表中的“待验证”逐个用年报、公告、官网产品页和投资者关系记录补证。
  2. 单独开一页“800G/1.6T产品拆解”,把DR、FR、LR、SR、OSFP、QSFP-DD、硅光、EML、LPO讲清楚。
  3. 单独开一页“光源与光芯片”,拆EML、CW、InP、SOI、VCSEL、硅光PIC。
  4. 单独开一页“CPO/NPO/OCS”,只讨论系统架构和时间表,不先做投资结论。

16. 图解一:一只光模块内部到底发生了什么

从外观看,光模块只是插在交换机上的小盒子;从功能看,它是一条“电到光,再从光到电”的小型系统。

交换机ASIC
  |
  | 高速电信号
  v
模块电接口
  |
  v
DSP / Retimer / CDR
  |
  +--> 发射侧:Driver -> EML或硅光调制器 -> 光信号 -> FAU/连接器 -> 光纤
  |
  +<-- 接收侧:光纤 -> 探测器PD -> TIA -> DSP -> 高速电信号

读这个图时,注意三条线:

  1. 信号线:电信号如何变成光信号,再变回电信号。
  2. 能耗线:DSP、驱动、激光器、散热分别消耗多少功率。
  3. 制造线:光芯片、无源器件、耦合封装和测试决定良率。

为什么高速光模块难?因为它不是某个单点零件变快,而是电信号、光源、调制、接收、封装、散热、测试和客户系统都要同时满足要求。某个环节短板,可能让整个模块无法通过认证。

17. 产品命名怎么读

初学者经常被 800G DR8 OSFP1.6T FR4QSFP-DD 这些名字吓住。可以拆成四层:

速率 + 距离/光学规格 + 通道数 + 封装形态
名称部分问什么示例理解
速率总带宽是多少400G、800G、1.6T
通道几条lane组成8x100G、4x200G、8x200G
距离/规格传多远、用什么光学方案SR、DR、FR、LR、ZR等
封装形态插在什么端口上QSFP-DD、OSFP、OSFP-XD等

常见缩写可先这样理解:

缩写入门解释注意点
SRShort Reach,短距多用于机房内短距,不一定是AI主线高价值环节
DRData center Reach,数据中心短中距800G/1.6T数通常见讨论对象
FR约2km级别中距更考验光源、调制和接收能力
LR更长距离不要和AI集群内部短距混看
ZR相干长距互联常见于数据中心互联、城域/长距,不是普通短距光模块
PSMParallel Single Mode,并行单模通道数和光纤数量影响连接器和布线
WDM波分复用在一根光纤上传多个波长,提高容量但增加光学复杂度

读公司产品页时,先不要被“1.6T”三个字带走,而要继续问:它是DR、FR还是别的规格?是OSFP还是QSFP-DD?是样品、送样、认证、量产,还是已经贡献收入?

18. 800G和1.6T到底难在哪里

从400G到800G,再到1.6T,本质是单位端口传输更多数据。难点不是把数字翻倍写在产品名上,而是每条lane的速率、功耗、误码率、散热、测试和制造良率都变难。

维度400G阶段800G阶段1.6T阶段
总带宽已较成熟AI数据中心主线之一下一阶段主线
lane组合4x100G或8x50G等8x100G或4x200G8x200G或16x100G
关键压力成本和客户认证DSP、EML/硅光、散热、交付200G/lane、测试、功耗、良率
公司验证能不能做高速能不能大规模交付能不能稳定量产并控制成本
研究误区把样品当收入把出货当利润把远期路线当短期现实

判断1.6T时尤其要小心:远期空间大,不等于当前所有公司都已经受益。需要拆客户时间表、产品认证、核心物料、产能、良率和收入确认。

19. 技术路线决策树

遇到“可插拔、LPO、NPO、CPO、硅光谁赢”的争论,不要急着站队。先按下面顺序判断:

第一步:场景
  是scale-out,还是scale-up?
  是机柜内短距,还是交换机之间?

第二步:客户
  是头部CSP自建网络,还是通用云/企业客户?
  客户愿不愿意牺牲互通性来换低功耗?

第三步:时间
  这条路线是今年量产、明年放量,还是2028年以后?

第四步:维护
  模块坏了能不能现场更换?
  故障定位在模块、主机、交换芯片还是封装里?

第五步:供应链
  光源、DSP、FAU、MPO、硅光PIC、测试设备谁卡住?

用这棵树,可以避免两个极端:

  • 把成熟可插拔模块过早判死刑。
  • 把CPO/NPO等远期路线完全忽略。

更稳妥的研究方式是把技术路线分成三类:

类型代表研究方式
当前兑现可插拔800G/1.6T、部分硅光可插拔看出货、ASP、毛利率、客户认证
过渡优化LPO/LRO/TRO、AOC/AEC、短距铜互联看客户试点、互通性、故障定位
远期重构NPO、CPO、光I/O、OCS看标准、生态、封装、维修和真实订单

20. 公司分析框架

光模块公司不能只按“有没有光模块”分类。建议按五层读。

20.1 第一层:它卖什么

卖的东西说明研究重点
整模块直接卖给云厂商、交换机厂、设备厂速率、客户、交付、物料、毛利
光源/光芯片卖EML、CW、VCSEL、DFB、探测器等速率、良率、客户认证、产能
无源光器件FAU、MPO、透镜、滤波、WDM等精度、专利、良率、路线无关性
电芯片DSP、Driver、TIA、CDR等200G/lane、功耗、替代风险
光纤/连接布线光纤、预端接、连接器组件是否进入数据中心高密度链条
系统客户GPU、交换机、云厂商决定规格,不一定直接捕获模块利润

20.2 第二层:它处在哪个速率阶段

同样是光模块,400G、800G和1.6T不是同一个竞争状态。公司如果只在低速或电信侧强,不能直接映射到AI数通高端链条。

20.3 第三层:它有没有客户认证

光模块不是做出来就能卖。头部客户通常要看产品稳定性、长期可靠性、兼容性、供货能力和故障响应。投资研究中最容易缺的不是“有没有样品”,而是“有没有通过核心客户认证并持续出货”。

20.4 第四层:它有没有物料控制力

模块厂的利润不只来自出货量。EML、CW光源、DSP、Driver、TIA、FAU、连接器和测试资源如果紧缺,谁能拿到料、谁能控制成本、谁能顺利交付,差异会很大。

20.5 第五层:它的收入纯度如何

多业务公司尤其要看收入纯度。公司名字里有“光”“通信”“连接”,不等于它的收入来自AI数据中心800G/1.6T。没有收入纯度,就很难做公司排序。

21. 负面覆盖怎么写

负面覆盖不是说公司一定不好,而是说“它当前不属于本专题核心节点”。光模块专题里常见负面覆盖有四类:

类型例子为什么要排除或降级
普通光纤光缆传统通信光纤、运营商光缆和800G/1.6T模块价值捕获不同
泛连接器普通电连接、普通光连接需要证明高密度MPO/数据中心客户
泛光芯片工业激光、激光雷达、低速通信不等于高端数通EML/CW
远期概念CPO、硅光、OCS小作文需要真实产品、客户和时间表

负面覆盖表要写清楚复查条件。例如“如果公司披露800G/1.6T客户认证、批量出货或高密度MPO产品收入,再重新评级”。这样排除不是主观否定,而是证据等级管理。

22. 初学者练习题

读完本专题后,可以用下面问题自测:

  1. 为什么AI训练集群比传统互联网业务更依赖高速网络?
  2. 光模块为什么不是单一零件,而是光、电、热、机械和软件的小系统?
  3. 800G和1.6T的难点分别在哪里?
  4. EML和CW光源分别在什么场景下重要?
  5. 硅光为什么不是“不要光源”?
  6. 可插拔、LPO、NPO、CPO为什么不能简单判断谁消灭谁?
  7. 为什么FAU/MPO可能成为路线无关节点?
  8. 为什么普通光纤公司不能直接按高端光模块逻辑估值?
  9. 判断一家A股公司是否真的受益,需要哪些数据?
  10. 哪些结论现在还只能算假设,不能写成事实?

如果这些问题能答出来,说明已经从“听名词”进入“读产业”的阶段。下一步就可以开始补公司年报、公告和客户认证资料。

23. 逐模块学习地图

从这一章开始,把前面的框架拆成八个学习模块。你可以把它当成以后所有科技专题的通用读法:先确定需求从哪里来,再看系统如何消化需求,再拆产品、BOM、制造、路线、公司和数据。这样做的好处是,不会被单个名词牵着走,也不会把投资材料里的某一句观点当成行业全貌。

学习模块要回答的核心问题光模块专题里的对应内容
需求模块为什么这个东西被需要,需求从哪里传导过来AI集群、GPU数量、交换机端口、Capex结构
网络模块系统怎么组织,哪些链路必须连接scale-out、scale-up、以太网、InfiniBand、机柜内/机柜间
产品模块客户实际买的是什么规格400G、800G、1.6T、DR/FR/LR、OSFP、QSFP-DD
BOM模块产品由哪些关键部件组成DSP、Driver、TIA、EML、CW、硅光PIC、FAU、MPO、散热
制造模块为什么做出来和稳定量产是两回事耦合、封装、测试、良率、可靠性、客户认证
路线模块不同技术路线分别解决什么矛盾可插拔、LPO/LRO/TRO、硅光、NPO、CPO、OCS
公司模块每家公司到底在哪一层捕获价值模块厂、光源厂、无源器件厂、DSP厂、系统客户、负面覆盖
数据模块哪些结论还不能写死出货量、ASP、客户时间表、物料份额、收入纯度

阅读顺序不建议从公司开始。初学者如果先看公司,很容易把“哪个公司涨得多”误认为“哪个公司产业位置最好”。更稳妥的读法是:先把需求和系统讲清楚,再看产品和BOM,最后把公司放回产业链。

24. 需求模块:从AI工作负载到光模块数量

需求模块要解决的问题是:为什么AI数据中心需要更多、更快、更贵的光互联。这里不能停留在“AI需求很大”这一句,因为这句话无法帮助你判断哪类公司受益,也无法区分真实需求和概念扩散。

AI集群里的数据交换主要来自三类任务。第一类是训练时的参数同步和梯度交换,很多GPU需要反复通信;第二类是推理服务中的多节点协同,尤其当模型、上下文长度和并发请求增大后,服务器之间的数据移动也会上升;第三类是存储、检查点、调度和故障恢复,虽然不总是被市场放在第一位,但在大型集群中同样消耗网络能力。

需求传导可以这样拆:

模型规模/推理流量
-> GPU或AI ASIC数量
-> 服务器数量和机柜数量
-> 交换机层级和端口数量
-> 每个端口需要的速率
-> 光模块、铜缆、AOC、连接器和布线
-> 光源、DSP、FAU/MPO、测试封装等上游需求

这个链条里最重要的不是某一个数字,而是“单位算力需要多少网络”。同样是增加GPU,如果网络架构更省链路,光模块需求可能没有线性增长;如果从400G切到800G或1.6T,模块单价、上游物料和制造难度又会变化。因此研究需求时要把“数量”和“规格”同时看。

分析需求模块时,建议每次都问五个问题:

  1. 这批AI集群是训练为主,还是推理为主?
  2. 用什么网络架构,是以太网、InfiniBand,还是客户自定义互联?
  3. 每一代GPU/ASIC平台对应什么交换机速率和端口密度?
  4. 端口连接用光模块、铜缆、AOC,还是混合方案?
  5. 采购节奏是一次性建设、分批交付,还是受库存和认证影响?

常见误区是把云厂商总Capex直接等同于光模块收入。Capex里有GPU、服务器、电力、散热、土地、建筑、交换机、存储和软件,光模块只是其中一层。更细的研究应该拆AI网络Capex,再拆光互联,再拆模块与上游器件。

本模块的数据缺口包括:头部客户AI网络Capex占比、每代平台端口配置、单GPU对应光模块数量、800G/1.6T采购节奏、铜互联替代比例、库存周期和客户认证时间。

25. 网络模块:先分清scale-out和scale-up

网络模块要解决的问题是:光模块到底服务哪一种连接。很多技术路线争论看起来很复杂,本质上是因为大家把不同网络场景放在一起讨论。

scale-out可以理解为横向扩展:很多服务器、很多机柜、很多交换机组成一个大集群。它强调可扩展、可维护、可采购、可替换。传统可插拔光模块在这里有很强的生态优势,因为模块坏了可以换,供应链成熟,交换机和光模块可以分工演进。

scale-up可以理解为更紧密的计算域互联:在较小范围内追求更高带宽、更低延迟和更低功耗。这里对连接距离、延迟、功耗和密度更敏感,因此更容易出现NPO、CPO、光引擎、光I/O等讨论。但它并不意味着传统可插拔立刻消失,而是说明系统架构中出现了新的优化方向。

还要分清距离:

距离层级典型连接研究重点
板内/板间芯片附近、高速电互联、未来光I/O信号损耗、封装、热管理、可维修性
机柜内GPU服务器、交换机、短距连接铜缆、AEC、AOC和短距光的成本功耗比较
机柜间/数据中心内交换机之间、服务器到交换机800G/1.6T可插拔、DR/FR、光源和连接器
数据中心间DCI、城域、长距传输相干光、长距模块,不要和AI集群内部混看

网络模块的分析重点是“链路地图”。你不需要一开始就画出完整数据中心拓扑,但至少要知道每类连接的距离、带宽、功耗和可维护要求。产品规格和技术路线都要回到这张链路地图上解释。

常见误区是把CPO当作“所有光模块的终局”。更准确的说法是:CPO试图解决极高带宽密度下的功耗和信号损耗问题,但它会引入维修、良率、封装、热管理和生态迁移问题。它更像系统架构重构的一种候选,而不是对所有可插拔模块的短期替换。

本模块的数据缺口包括:头部客户不同网络层级的端口数量、scale-out和scale-up的光互联用量差异、铜缆/AOC/光模块分工、交换机平台代际、NPO/CPO真实导入时间表。

26. 产品模块:把产品名拆成可研究的句子

产品模块要解决的问题是:客户实际买的是什么。光模块行业的名词很多,初学者容易被800G DR8 OSFP1.6T FR4LPO硅光这些词吓住。其实可以统一拆成一句话:

总速率是多少,用几条lane实现,传多远,插在什么封装里,采用什么光学/电学方案,是否已经量产认证。

800G DR8 OSFP为例,不要只看到800G。它至少包含五个问题:800G是总带宽;DR说明距离规格;8说明可能涉及多通道并行;OSFP说明封装形态;真正的研究还要问它用EML、硅光还是其他方案,用不用DSP,功耗多少,客户是谁,量产到什么阶段。

产品模块最重要的四个维度是:

维度问题为什么影响研究
速率400G、800G、1.6T还是更高决定产品代际和上游物料难度
lane100G/lane还是200G/lane决定电芯片、光源、测试和良率压力
距离SR、DR、FR、LR、ZR决定光源、调制、接收和应用场景
封装OSFP、QSFP-DD、AOC、未来NPO/CPO决定端口密度、散热和可维护性

分析产品模块时,最容易犯的错是把“样品发布”当成“产业地位”。样品说明公司可能具备研发能力,但投资研究和产业研究更关心客户认证、批量交付、良率、物料成本、ASP和售后稳定性。尤其是1.6T,不能因为产品页出现了1.6T字样,就默认公司已经获得同等收入和利润。

产品模块还要和公司模块相连。模块厂的产品线越完整,越可能覆盖不同客户规格;光源厂要看它的EML或CW是否匹配高速产品;无源器件厂要看它的FAU/MPO是否进入高密度产品;DSP厂要看它的芯片是否支持下一代lane速率。

本模块的数据缺口包括:各公司800G/1.6T产品规格、是否送样/认证/量产、对应客户、功耗、主要BOM、ASP区间、产品毛利率和新老产品切换节奏。

27. BOM模块:一只模块不是一个零件

BOM模块要解决的问题是:光模块的价值和难度到底藏在哪些部件里。把光模块看成一个盒子,会错过真正的产业分工;把每个部件孤立看,又会看不懂它们为什么互相制约。

一只高速光模块大致可以分成六组部件:

  1. 电信号处理:DSP、CDR、Retimer、Driver、TIA。
  2. 光发射:EML、CW激光器、调制器、硅光PIC。
  3. 光接收:PD、TIA、接收端模拟链路。
  4. 无源光学:FAU、透镜、滤波、WDM、MPO、LC、SN等。
  5. 机械热管理:壳体、散热、屏蔽、结构件。
  6. 固件测试:监控、诊断、兼容性、产线测试和可靠性验证。

这些部件不是简单相加。DSP可以提高链路稳定性,但会增加功耗和成本;LPO试图减少模块侧DSP,却把难度转移到主机侧、链路调试和互通性。硅光可以提高集成潜力,但仍然要依赖CW光源、耦合封装和测试。FAU/MPO本身不产生光,却可能影响高密度连接的良率和可靠性。

BOM模块要特别关注“路线无关节点”。如果一个部件在可插拔、硅光、NPO、CPO中都可能被用到,它就比单一路线叙事更值得长期跟踪。例如高可靠光源、精密耦合、FAU、高密度连接、测试设备可能在多条路线里都重要,只是用量、形态和客户不同。

常见误区是把某个部件的概念外延放得过大。比如“激光芯片”不等于“高端数通EML/CW”;“连接器”不等于“高密度MPO/MTP”;“光纤”不等于“AI高价值光模块瓶颈”;“硅光”不等于“所有传统光学部件都被替代”。

本模块的数据缺口包括:核心BOM成本占比、光源/DSP/FAU/MPO供应份额、国产替代进度、关键物料交期、物料涨跌价、模块厂物料自供比例和不同路线下BOM结构变化。

28. 制造模块:样品、认证、量产是三件事

制造模块要解决的问题是:为什么“能做出来”和“能持续交付”差别很大。高速光模块是光、电、机械、热和软件的综合系统,量产难点往往不在一句技术名词里,而在长期稳定的一致性。

制造环节可以按五步理解:

关键芯片和器件准备
-> 光电封装和耦合
-> 模块组装和热设计
-> 高速测试和老化验证
-> 客户认证和规模交付

光电耦合是制造里很关键的一环。光纤、FAU、透镜、光芯片或硅光PIC之间需要非常精确地对准,偏差会带来损耗、良率下降和可靠性问题。速率越高、通道越多、封装越紧凑,这个问题越难。

测试同样重要。高速模块要看误码率、眼图、功耗、温度、长期稳定性、兼容性和批次一致性。1.6T阶段,测试时间、测试设备、测试成本和良率都会影响公司交付能力。客户认证则像最后一道门槛:模块在自家实验室跑通,不等于能在客户系统里长期稳定运行。

制造模块和公司分析直接相关。模块厂要看良率、交付、客户认证和售后;设备厂要看封装测试设备是否进入真实产线;无源器件厂要看精密制造和自动化;光芯片厂要看外延、芯片良率和可靠性。

常见误区是只看发布会或展会样品。展会样品适合证明方向,但不能证明收入质量。真正影响财务的是批量订单、良率爬坡、成本下降、售后稳定和客户复购。

本模块的数据缺口包括:各公司量产阶段、客户认证状态、良率、测试瓶颈、扩产节奏、设备采购、可靠性指标、退货率和单位制造成本。

29. 路线模块:每条路线都是在取舍

路线模块要解决的问题是:不同技术路线到底在解决什么矛盾。不要把路线当成口号,也不要急着问谁是终局。更好的问法是:这条路线牺牲了什么,换来了什么,适合哪个时间和场景。

路线主要想解决的问题主要代价
可插拔DSP模块成熟生态、可维护、稳定传输功耗和成本压力上升
LPO/LRO/TRO降低模块侧功耗和BOM主机侧要求更高,互通和故障定位更复杂
硅光可插拔提高集成度,改善规模制造潜力依赖CW光源、耦合、良率和封装
NPO让光引擎更靠近交换芯片,降低电传输损耗生态、散热、维修和标准仍需成熟
CPO光学与交换芯片共封装,追求系统级低功耗高密度维修、良率、封装、测试和供应链重构难度高
OCS用光交换改善网络调度或降低部分电交换压力架构复杂,是否增量要看客户网络设计

路线研究要把时间分层:当前兑现、过渡优化、远期重构。当前兑现看订单和收入;过渡优化看客户试点和互通性;远期重构看标准、生态、工程约束和真实路线图。把远期路线当短期收入,会高估相关公司;完全忽略远期路线,又会错过价值链迁移。

路线模块还要反向映射BOM。比如LPO如果减少模块侧DSP,可能影响DSP价值,但会提高主机侧调试和系统责任;硅光如果增加CW光源需求,就要看光源厂和耦合封装;CPO如果靠近交换芯片,就要看交换芯片厂、光引擎、FAU、封装和测试。

常见误区有两个极端:一个是“可插拔马上被淘汰”,另一个是“远期路线都是故事”。教材口径应当介于两者之间:可插拔仍是短中期重要主线,远期路线必须跟踪,但要分场景、时间和证据等级。

本模块的数据缺口包括:头部客户路线时间表、LPO试点结果、硅光量产良率、NPO/CPO标准与生态、OCS实际部署案例、各路线对光源/DSP/FAU/MPO/测试设备的用量变化。

30. 公司模块:把标的变成产业角色

公司模块要解决的问题是:每家公司到底凭什么和本专题相关。这里不要先按市场热度排序,而要先按产业角色排序。

第一层是核心模块厂。它们直接面对800G/1.6T需求,价值来自产品设计、物料管控、客户认证、良率和规模交付。研究它们时,重点不是“有没有高速模块”,而是产品是否被客户认证,是否稳定量产,物料是否顺畅,毛利率是否能维持。

第二层是光源和光芯片。它们可能是高速模块和硅光路线的重要瓶颈,但要严格区分电信侧、接入侧、工业激光和高端数通。只有进入800G/1.6T、EML、CW光源或硅光供应链,才算和本专题强相关。

第三层是无源光器件。FAU、MPO、透镜、滤波、WDM等容易被低估,因为它们不如芯片名词显眼。但在高密度光互联里,对准精度、低损耗、可靠性和批量一致性可能非常关键。

第四层是电芯片和系统芯片。DSP、Driver、TIA、交换芯片会决定产品速率和路线演进。海外大公司往往业务很大,读它们更多是为了理解规格和供应链,而不是简单映射成“光模块标的”。

第五层是系统客户和设备厂。GPU、交换机、云厂商决定需求和规格,但它们本身不是光模块公司。研究它们是为了理解需求传导、客户路线和采购节奏。

第六层是边缘相关和负面覆盖。普通光纤、泛连接器、传统电信光模块、工业激光和只有概念的公司,都需要写清楚为什么当前不放在核心位置。负面覆盖不是否定公司,而是防止研究边界被概念稀释。

公司模块建议使用统一分析框架:

  1. 它卖什么:模块、光源、无源器件、电芯片、设备、材料、系统,还是只是概念相关?
  2. 卖给谁:云厂商、模块厂、交换机厂、运营商,还是非数据中心客户?
  3. 用在哪:800G/1.6T、硅光、CPO/NPO、普通电信、工业或消费?
  4. 证据是什么:产品页、公告、年报、客户认证、收入、订单还是市场传闻?
  5. 收入纯度多少:相关业务占总收入多少,是否足以影响财务?
  6. 风险在哪里:技术路线变化、客户集中、ASP下行、物料紧缺、认证失败还是概念错配?

本模块的数据缺口包括:公司高端数通收入占比、客户认证、产品规格、毛利率、关键物料来源、订单能见度、份额、负面覆盖复查条件。

31. 数据模块:把未知保留下来

数据模块要解决的问题是:哪些结论现在还不能下。成熟的研究不是把所有空白都填成判断,而是把空白标出来,告诉自己下一步怎么补。

光模块专题最重要的数据可以分成四层:

优先级数据为什么重要
P0800G/1.6T出货量、ASP、客户结构、公司收入纯度不补就无法判断主链是否成立
P1光源/DSP/FAU/MPO供需、200G/lane良率、产品认证决定瓶颈、份额和盈利质量
P2铜互联替代、OCS增量、国内外规格差异、连接布线价值量决定边缘节点和路线分歧
P3标准术语、远期3.2T、光I/O、更多供应商细节决定后续下钻,但不影响当前主线

数据模块还要区分事实、假设和推论。事实是可以直接找到证据的,例如公司产品页、公告、财报、标准说明。假设是合理但尚未完全证实的判断,例如“某类FAU可能具备路线无关属性”。推论是从事实和假设推出来的结论,例如“如果硅光放量,CW光源和耦合封装的重要性提高”。三者不能混写。

补数据时,优先级不要被市场热度左右。先补P0,再补P1。比如“某公司是不是核心标的”看起来很急,但如果没有它的高端数通收入纯度和客户认证,结论就只能停留在待验证。

本模块的常见误区是把缺口当成结论。例如“公司有光芯片”不能自动推出“公司受益800G”;“云厂商Capex增加”不能自动推出“所有光通信公司收入增加”;“CPO是方向”不能自动推出“所有CPO概念公司都受益”。

数据模块下一步要形成三张表:产品规格表、公司证据表、路线时间表。产品规格表解决“买的是什么”;公司证据表解决“谁真的参与”;路线时间表解决“什么时候兑现”。

32. 读完本专题后应该形成的能力

这份教材不是为了让你背名词,而是为了让你能独立拆一个科技专题。读完后,至少应该形成四种能力。

第一,能把需求传导讲清楚。你应该能从AI工作负载讲到GPU集群,再讲到交换机端口、链路数量、光模块速率和上游物料,而不是只说“AI拉动光模块”。

第二,能把产品名拆开。看到800G、1.6T、DR、FR、OSFP、QSFP-DD、LPO、硅光时,你不需要马上知道所有细节,但要知道应该继续问哪些问题。

第三,能把公司放回产业角色。看到一家公司时,先判断它是模块、光源、无源器件、电芯片、光纤、设备、系统客户,还是负面覆盖对象,再决定该用什么证据验证它。

第四,能把未知写成清单。研究不是装作什么都知道,而是把关键数据缺口放在台面上,一项一项补。只要能持续维护数据缺口,这个专题就会越来越像一套可复用的行业研究系统。

下一版建议优先补三类内容:第一,800G/1.6T产品规格表;第二,核心公司证据卡;第三,光源、DSP、FAU/MPO三个上游瓶颈的单独下钻页。