光模块专题教材 v0.3
从零理解 AI 数据中心里的高速光互联:先需求、再网络、再产品、再BOM、再制造、再路线、再公司。
日期:2026-06-27
状态:专题教材第三版,逐模块详解版。旧的“全科技系统教材”先搁置,本文件作为新的专题教材样板。目标不是先给投资结论,而是让一个电子行业初学者能顺着读懂:光模块是什么、为什么AI数据中心需要它、产业链怎么拆、技术路线为什么有分歧、哪些节点可能是真瓶颈、公司应该怎么映射、哪些数据还缺。
本版相对 v0.2 的增量:把原来的框架继续扩写成八个可反复阅读的学习模块:需求、网络、产品、BOM、制造、路线、公司、数据。每个模块都按“是什么、为什么难、怎么分析、常见误区、数据缺口”展开,便于直接作为专题教材使用。可视化入口见 ..\..\visualizations\optical_module_industry.html。
0. 本专题先解决什么
光模块是AI基础设施里最容易被误读的环节之一。市场常把它讲成“800G、1.6T、CPO、硅光、LPO、NPO”这些名词的竞赛,但初学者真正需要先弄清楚三件事:
- 光模块在系统里做什么。
- AI服务器和交换机为什么把光模块推到核心位置。
- 技术路线变化会改变哪些产业节点,哪些节点又可能不受路线影响。
这版教材采用“先系统、再产品、再BOM、再路线、再公司”的顺序。投资材料只作为线索,不作为内容边界。
1. 一句话理解光模块
光模块是把电信号和光信号互相转换的高速接口。
在数据中心里,GPU服务器、交换机、网卡之间需要传输海量数据。芯片内部处理的是电信号,但长距离、高带宽传输更适合用光纤和光信号。光模块插在交换机或服务器端口上,把设备里的高速电信号转换成光信号,通过光纤发出去;另一端的光模块再把光信号转换回电信号。
可以先把它想成一个“高速翻译器”:
设备里的电信号 -> 光模块发射端 -> 光纤传输 -> 光模块接收端 -> 设备里的电信号
如果没有这个翻译器,AI集群里的GPU、交换机、存储和服务器就很难用足够高的带宽连接起来。
2. 为什么AI数据中心拉动光模块
传统数据中心也需要光模块,但AI数据中心把问题放大了。
普通互联网业务更多是用户访问网页、视频、数据库,流量主要在服务器和外部网络之间流动。AI训练和推理不一样,它要求大量GPU、CPU、内存、存储和交换机在集群内部高频交换数据。模型越大、集群越大、并行度越高,网络带宽、延迟和稳定性越重要。
AI基础设施对光模块的拉动来自三层:
- 集群规模变大:GPU数量增加,交换机端口和链路数量增加。
- 速率升级:从100G、200G、400G走向800G、1.6T,单端口带宽提升。
- 网络结构变化:scale-out、scale-up、液冷、电力约束、交换架构变化,都会影响光模块数量、形态和上游部件。
这里要先区分两个词:
| 场景 | 含义 | 对光模块的启发 |
|---|---|---|
| Scale-out | 多台服务器、多台交换机之间横向扩展 | 需要大量可插拔光模块、光纤、连接器和交换机端口 |
| Scale-up | 同一计算域内更紧密、更低延迟互联 | 可能催生NPO、CPO、光引擎、更多短距高密度光互联 |
很多争论来自把这两个场景混在一起。可插拔光模块、LPO、NPO、CPO不是简单的“谁消灭谁”,而是不同场景、不同时间、不同客户架构下的选择。
3. 光模块在系统里的位置
先画一条系统链:
AI应用/模型
-> 云厂商资本开支
-> GPU/ASIC服务器
-> 网卡/交换机/网络拓扑
-> 光模块/铜缆/AOC
-> 光纤/连接器/机柜布线
-> 上游光芯片、DSP、驱动、TIA、FAU、MPO、封装测试
这条链的关键不是“AI需求大,所以所有光通信公司都好”,而是要追问:
- 需求落在哪种网络:以太网、InfiniBand、专有互联,还是混合架构?
- 端口速率是什么:400G、800G、1.6T,还是更高?
- 传输距离是什么:机柜内、机柜间、数据中心内、数据中心间?
- 采用什么形态:可插拔模块、AOC、铜缆、LPO、NPO、CPO?
- 瓶颈在哪里:光源、DSP、光器件、连接器、良率、测试、热管理、客户认证?
4. 光模块内部拆解
光模块不是一个单一零件,而是一组光、电、热、机械和软件的组合。
| 内部部分 | 作用 | 为什么重要 |
|---|---|---|
| 电接口 | 和交换机/网卡端口连接,接收高速电信号 | 端口速率提升后,信号完整性和功耗压力上升 |
| DSP/Retimer | 对高速信号进行均衡、纠错、重定时等处理 | 传统高端模块的关键芯片之一,也带来功耗和成本 |
| 驱动器/调制器 | 驱动激光器或调制光信号 | 影响带宽、功耗、线性度和可靠性 |
| 光源/激光器 | 产生光信号,常见路线包括EML、CW激光器、VCSEL等 | 800G/1.6T阶段常被讨论为供给瓶颈 |
| 探测器/TIA | 接收光信号并转成电信号 | 接收端灵敏度、噪声和带宽影响链路质量 |
| 硅光/PIC | 把部分光学功能集成到芯片上 | 可能降低封装复杂度和功耗,但依赖光源、耦合、良率 |
| FAU/透镜/滤波器 | 光纤阵列、耦合和无源光学处理 | 高密度光互联下对准精度和良率很关键 |
| MPO/LC/SN等连接器 | 光纤连接和布线接口 | 光纤数量增加后,连接可靠性和密度变重要 |
| 壳体/散热 | 控制模块温度和机械稳定性 | 1.6T模块功耗提高,散热成为系统约束 |
| 固件/监控 | 诊断、管理、兼容和可靠性监控 | 大客户认证和长期运行依赖可管理性 |
初学者读光模块公司时,不要只看“有没有800G/1.6T产品”。更重要的是看它到底掌握哪个环节:模块集成、光芯片、DSP、硅光、光器件、连接器、封装测试,还是只是做低速或电信侧产品。
5. 速率和形态怎么理解
光模块速率不是凭空升级,而是跟交换芯片、网络架构和电接口一起升级。
| 速率 | 常见理解 | 关键变化 |
|---|---|---|
| 400G | AI早期和传统云升级的重要阶段 | 100G/lane或更早架构逐步成熟 |
| 800G | 当前AI数据中心主线之一 | 8x100G或4x200G,模块功耗、光源、DSP和良率压力上升 |
| 1.6T | 下一阶段高带宽主线 | 8x200G或16x100G,200G/lane、散热、测试和供应链更难 |
| 3.2T及以后 | 远期方向 | 需要更高集成、更低功耗和系统级架构变化 |
形态也要分清:
| 形态 | 简单解释 | 研究重点 |
|---|---|---|
| QSFP-DD | 常见可插拔形态之一 | 密度、散热、兼容性、客户生态 |
| OSFP | AI数据中心常见高功耗可插拔形态 | 800G/1.6T支持能力、散热、系统匹配 |
| OSFP-XD | 更高密度形态探索 | 是否进入主流客户架构仍需跟踪 |
| AOC | 光模块和光纤一体化线缆 | 短距、部署便利性、成本 |
| DAC/AEC/ACC | 铜缆或有源铜缆 | 机柜内短距可能替代部分光模块 |
6. 传输距离和光源路线
光模块不只按速率分类,也按传输距离分类。距离不同,技术路线会不同。
| 距离/场景 | 常见方案 | 产业含义 |
|---|---|---|
| 机柜内短距 | 铜缆、AEC、AOC、短距光模块 | 成本、功耗和布线便利性重要 |
| 机柜间/数据中心内 | 800G/1.6T DR/FR等单模方案 | 高速光模块、光源、DSP、连接器需求强 |
| 数据中心间 | 相干光、长距传输 | 与短距数通光模块不是同一套逻辑 |
常见光源路线:
| 路线 | 基本含义 | 优点 | 风险/难点 |
|---|---|---|---|
| VCSEL | 多用于短距多模场景 | 成本和功耗优势 | 距离和带宽上限受限 |
| EML | 电吸收调制激光器,高速数通常见 | 高速、长距离能力强 | InP工艺、产能、良率、成本和供应紧张 |
| CW激光器 + 硅光 | 外置连续波光源配合硅光调制 | 有利于高集成和部分低功耗方案 | 光源功率、耦合、硅光良率、供应链成熟度 |
| 相干光 | 复杂调制和长距离传输 | 适合DCI/城域/长距 | 与AI集群短距互联不能简单混看 |
这里的核心教材结论是:不要把“硅光”理解为完全绕开光源。硅光改变的是集成和调制方式,但仍然需要高可靠光源、耦合、封装和测试。
7. 五条技术路线的关系
光模块专题最容易被“终局路线”带偏。第一版教材不押单一路线,而是按场景理解。
| 路线 | 它想解决什么 | 可能适用场景 | 需要跟踪什么 |
|---|---|---|---|
| 传统可插拔DSP模块 | 兼容性强、生态成熟、链路能力稳定 | scale-out网络、主流交换机端口 | 800G/1.6T需求、DSP供应、模块功耗、ASP |
| LPO/LRO/TRO | 减少或部分减少模块侧DSP,降低功耗和成本 | 受控环境、短距、高度优化的数据中心 | 主机侧能力、互通性、客户认证、故障定位 |
| 硅光可插拔 | 用硅光平台提高集成度和潜在成本效率 | DR/FR等高速数通场景 | CW光源、耦合、良率、量产和客户导入 |
| NPO | 光引擎靠近交换芯片但仍保留一定可维护性 | 更高带宽密度、更低功耗需求 | 交换芯片平台、封装、散热、可维护性 |
| CPO | 光学和交换芯片共封装,追求系统级低功耗 | 未来scale-up或极高密度交换 | 生态成熟度、维修替换、良率、标准、客户采用时间 |
本地材料里反复出现的一个有效提醒是:路线之争不能替代产业拓扑。与其猜“哪条路线一定赢”,不如找不同路线都绕不开的节点,例如高功率光源、部分光芯片、FAU、MPO/高密度连接、测试和封装能力。
8. 产业拓扑
下游需求:
AI训练/推理 -> 云厂商Capex -> GPU/ASIC集群 -> 交换机/网卡/网络拓扑
系统层:
GPU服务器 / AI加速卡 / 交换机 / NIC / DPU / 机柜布线 / 数据中心网络
光互联形态:
可插拔光模块 / AOC / LPO-LRO-TRO / NPO / CPO / OCS
模块与组件:
800G/1.6T光模块 / 光引擎 / 硅光模块 / 相干模块 / 连接器组件
核心半导体:
DSP / Driver / TIA / CDR / 光芯片 / 硅光PIC / 调制器 / 探测器
光学与无源器件:
EML / CW激光器 / VCSEL / FAU / 透镜阵列 / 滤波片 / WDM / MPO / LC / SN
材料与制造:
InP衬底 / SOI衬底 / 光纤玻璃 / 陶瓷插芯 / 精密加工 / 耦合封装 / 测试设备
客户与认证:
云厂商 / 交换机厂 / 服务器厂 / 网络设备厂 / 模块厂互供 / 代工厂
9. 节点研究
9.1 模块集成厂
模块集成厂负责把光芯片、DSP、驱动、TIA、无源光学、连接器、壳体、固件和测试整合成客户可用的光模块。它的壁垒不是“会装”,而是高速产品设计、物料管控、良率、可靠性、客户认证和大批量交付。
研究重点:
- 是否具备800G和1.6T产品线。
- 是否覆盖EML和硅光路线。
- 关键物料是否受制于外部供应。
- 是否进入头部云厂商/网络设备厂供应链。
- 收入是否真的来自高端数通,而不是低速电信或传统产品。
9.2 光芯片和光源
光源是光模块的发射起点。EML、CW激光器、VCSEL、DFB等对应不同速率和距离场景。AI数据中心拉动800G/1.6T时,市场常讨论EML和CW激光器的供给瓶颈。
研究重点:
- 100G/lane、200G/lane产品进展。
- InP工艺能力、良率、可靠性。
- CW光源是否进入硅光模块供应链。
- 客户认证和批量出货,不只看样品。
- 国产厂商是电信侧产品为主,还是已经进入高端数通。
9.3 DSP、Driver、TIA等电芯片
传统可插拔高端光模块通常需要DSP处理高速信号。DSP决定性能,也增加成本和功耗。LPO/LRO/TRO等路线的核心变化之一,就是试图减少或改变DSP的位置和功能。
研究重点:
- 800G/1.6T DSP供应格局。
- 200G/lane电接口进度。
- DSP是否被LPO/NPO/CPO部分替代。
- 模块厂能否拿到足够DSP供应。
- Driver/TIA等模拟芯片是否有国产替代机会。
9.4 FAU、MPO和无源光器件
FAU是光纤阵列单元,用来把多根光纤高精度排列并与光芯片或光引擎耦合。MPO是高密度多芯光纤连接器。速率提升和光纤数量增加后,这些无源器件不再只是普通配件,而可能成为高精密制造节点。
研究重点:
- 对准精度、良率、自动化能力。
- CPO/NPO/硅光路线下的用量变化。
- 是否路线无关:不管可插拔、硅光、NPO、CPO,光纤耦合和连接通常都绕不开。
- 专利、客户认证和大批量交付。
9.5 硅光与衬底
硅光把部分光学功能集成到硅基平台上,理论上有利于集成度、规模制造和功耗优化。但硅光不是万能答案,它仍然依赖CW光源、耦合封装、测试、热管理和客户生态。
研究重点:
- 硅光PIC量产能力。
- CW光源供应和功率稳定性。
- SOI衬底质量和供应。
- 与传统EML方案的成本、功耗、良率比较。
- 是否进入真实客户订单。
9.6 光纤、连接和布线
AI集群用到大量光纤和连接器,但光纤公司不一定自动成为光模块主线核心。光纤是必要基础设施,和高端光模块的价值捕获不在同一层。
研究重点:
- 光纤总量和数据中心内部布线需求。
- 多芯连接器、预端接、MPO/MTP组件的价值量。
- 普通通信光纤扩产是否会压价格。
- 公司业务是否只是传统光缆,还是有数据中心高密度连接能力。
10. 公司映射的正确顺序
不要先列股票池。先把公司放进产业角色。
| 角色 | 判断标准 | 示例方向 |
|---|---|---|
| 核心模块厂 | 高速数通模块、客户认证、规模交付 | 800G/1.6T模块厂 |
| 上游光源/光芯片 | EML/CW/VCSEL等核心器件 | InP光芯片、CW光源 |
| DSP/电芯片 | 800G/1.6T信号处理 | PAM4 DSP、Driver、TIA |
| 无源光器件 | FAU、MPO、透镜、WDM等 | 高精密耦合和连接 |
| 设备与测试 | 高速测试、耦合、封装自动化 | 224G/200G lane测试 |
| 系统/客户 | GPU、交换机、云厂商 | 决定规格和采购节奏 |
| 边缘相关 | 光纤、普通连接器、传统电信模块 | 需要证明高端数通暴露 |
| 负面覆盖 | 只有概念,没有产品/客户/份额 | 只保留复查条件 |
11. 常见误判
- 把CPO当作短期替代全部可插拔模块的结论。
- 把硅光当作彻底绕开光源和封装的路线。
- 把普通光纤、普通连接器、传统电信光模块直接映射到AI数据中心高端光模块。
- 只看速率名词,不看传输距离、形态、客户和认证。
- 只看公司是否发布样品,不看是否量产、良率、交付和收入。
- 把模块厂、光源厂、无源器件厂、DSP厂放进同一个估值逻辑。
- 把海外客户Capex直接等同于每一家A股公司收入。
- 用股价排序反推产业地位。
12. 本版研究假设
| 假设 | 当前等级 | 说明 | 还缺什么 |
|---|---|---|---|
| AI数据中心推动800G/1.6T光模块需求升级 | L2/L3 | 公开产品、标准路线和客户Capex方向都支持高速光互联升级 | 800G/1.6T真实出货量、ASP、客户结构 |
| 可插拔模块仍是短中期主线,但NPO/CPO值得作为后续路线跟踪 | L2 | OSFP/QSFP-DD生态成熟,CPO/NPO仍处于客户导入和生态建设阶段 | 头部客户时间表、真实采购、维修和良率数据 |
| EML/CW光源、DSP、FAU/MPO可能是关键瓶颈 | L1/L2 | 本地材料和公开产品资料均指向高端器件重要性 | 供应份额、产能、价格、客户认证 |
| 硅光是重要路线,但不是“无光源路线” | L2 | 硅光仍依赖CW光源、耦合和封装 | 各厂量产良率和成本对比 |
| 光模块不是一个统一Beta行业,节点之间分化会很大 | L1/L2 | 模块、光源、DSP、无源器件、光纤的价值捕获不同 | 公司收入纯度和产品结构 |
13. 数据缺口优先级
P0缺口:
- 800G、1.6T光模块全球出货量、ASP和产品结构。
- 头部云厂商/网络设备厂对可插拔、LPO、NPO、CPO的采用时间表。
- EML、CW光源、DSP、FAU/MPO的供需和供应商份额。
- A股公司高端数通收入纯度、客户认证和出货等级。
P1缺口:
- 200G/lane方案良率、功耗、散热和测试成本。
- 模块厂物料管控能力和关键物料来源。
- 硅光方案与EML方案的成本、功耗和可靠性对比。
- CPO/NPO方案的维修、标准、生态和商业模式。
P2缺口:
- 光纤/连接器/布线价值量。
- OCS与光模块需求之间的替代或增量关系。
- 国内算力与海外算力对光模块规格的差异。
14. 参考资料
本版主要使用本地材料作为研究线索,并用公开资料校验技术和产品口径。
本地线索:
F:\投资知识库\20_reference_frameworks\douyin_touzhijunjun\frameworks\versions\2026-05-12_v0.1.mdF:\投资知识库\30_archive_text\douyin_touzhijunjun\2026\2026-06-16_别跟大佬盘CPO了,买方简单题都赚完了,抄作业就行_7651891863795944767\summary.mdF:\投资知识库\30_archive_text\douyin_touzhijunjun\2026\2026-06-04_光模块,职业买方为啥从来不单票梭哈?_7647484071781748018\summary.md
公开资料:
- Ethernet Alliance 2025 Roadmap/OFC信息:https://ethernetalliance.org/blog/2025/03/17/ethernet-alliance-showcases-future-ready-ethernet-innovation-at-ofc-2025/
- OSFP MSA说明:https://osfpmsa.org/
- OIF当前工作说明:https://www.oiforum.com/technical-work/current-work/
- LPO MSA FAQ:https://www.lpo-msa.org/home/faqs.html
- Marvell PAM4 DSP产品页:https://www.marvell.com/products/pam-dsp.html
- Coherent 1.6T-DR8 OSFP产品页:https://www.coherent.com/networking/transceivers/datacom/FTCF2519E3PCA
- 中际旭创产品页:https://products.zj-innolight.com/
- 新易盛产品页:https://www.eoptolink.com/
- 天孚通信产品与服务页:https://www.tfcsz.com/product_service.html
- 光迅科技OFC 2024新品信息:https://www.accelink.com/lighting_your_dreams/1773182305532170242.html
15. 下一步
- 把标的覆盖表中的“待验证”逐个用年报、公告、官网产品页和投资者关系记录补证。
- 单独开一页“800G/1.6T产品拆解”,把DR、FR、LR、SR、OSFP、QSFP-DD、硅光、EML、LPO讲清楚。
- 单独开一页“光源与光芯片”,拆EML、CW、InP、SOI、VCSEL、硅光PIC。
- 单独开一页“CPO/NPO/OCS”,只讨论系统架构和时间表,不先做投资结论。
16. 图解一:一只光模块内部到底发生了什么
从外观看,光模块只是插在交换机上的小盒子;从功能看,它是一条“电到光,再从光到电”的小型系统。
交换机ASIC
|
| 高速电信号
v
模块电接口
|
v
DSP / Retimer / CDR
|
+--> 发射侧:Driver -> EML或硅光调制器 -> 光信号 -> FAU/连接器 -> 光纤
|
+<-- 接收侧:光纤 -> 探测器PD -> TIA -> DSP -> 高速电信号
读这个图时,注意三条线:
- 信号线:电信号如何变成光信号,再变回电信号。
- 能耗线:DSP、驱动、激光器、散热分别消耗多少功率。
- 制造线:光芯片、无源器件、耦合封装和测试决定良率。
为什么高速光模块难?因为它不是某个单点零件变快,而是电信号、光源、调制、接收、封装、散热、测试和客户系统都要同时满足要求。某个环节短板,可能让整个模块无法通过认证。
17. 产品命名怎么读
初学者经常被 800G DR8 OSFP、1.6T FR4、QSFP-DD 这些名字吓住。可以拆成四层:
速率 + 距离/光学规格 + 通道数 + 封装形态
| 名称部分 | 问什么 | 示例理解 |
|---|---|---|
| 速率 | 总带宽是多少 | 400G、800G、1.6T |
| 通道 | 几条lane组成 | 8x100G、4x200G、8x200G |
| 距离/规格 | 传多远、用什么光学方案 | SR、DR、FR、LR、ZR等 |
| 封装形态 | 插在什么端口上 | QSFP-DD、OSFP、OSFP-XD等 |
常见缩写可先这样理解:
| 缩写 | 入门解释 | 注意点 |
|---|---|---|
| SR | Short Reach,短距 | 多用于机房内短距,不一定是AI主线高价值环节 |
| DR | Data center Reach,数据中心短中距 | 800G/1.6T数通常见讨论对象 |
| FR | 约2km级别中距 | 更考验光源、调制和接收能力 |
| LR | 更长距离 | 不要和AI集群内部短距混看 |
| ZR | 相干长距互联 | 常见于数据中心互联、城域/长距,不是普通短距光模块 |
| PSM | Parallel Single Mode,并行单模 | 通道数和光纤数量影响连接器和布线 |
| WDM | 波分复用 | 在一根光纤上传多个波长,提高容量但增加光学复杂度 |
读公司产品页时,先不要被“1.6T”三个字带走,而要继续问:它是DR、FR还是别的规格?是OSFP还是QSFP-DD?是样品、送样、认证、量产,还是已经贡献收入?
18. 800G和1.6T到底难在哪里
从400G到800G,再到1.6T,本质是单位端口传输更多数据。难点不是把数字翻倍写在产品名上,而是每条lane的速率、功耗、误码率、散热、测试和制造良率都变难。
| 维度 | 400G阶段 | 800G阶段 | 1.6T阶段 |
|---|---|---|---|
| 总带宽 | 已较成熟 | AI数据中心主线之一 | 下一阶段主线 |
| lane组合 | 4x100G或8x50G等 | 8x100G或4x200G | 8x200G或16x100G |
| 关键压力 | 成本和客户认证 | DSP、EML/硅光、散热、交付 | 200G/lane、测试、功耗、良率 |
| 公司验证 | 能不能做高速 | 能不能大规模交付 | 能不能稳定量产并控制成本 |
| 研究误区 | 把样品当收入 | 把出货当利润 | 把远期路线当短期现实 |
判断1.6T时尤其要小心:远期空间大,不等于当前所有公司都已经受益。需要拆客户时间表、产品认证、核心物料、产能、良率和收入确认。
19. 技术路线决策树
遇到“可插拔、LPO、NPO、CPO、硅光谁赢”的争论,不要急着站队。先按下面顺序判断:
第一步:场景
是scale-out,还是scale-up?
是机柜内短距,还是交换机之间?
第二步:客户
是头部CSP自建网络,还是通用云/企业客户?
客户愿不愿意牺牲互通性来换低功耗?
第三步:时间
这条路线是今年量产、明年放量,还是2028年以后?
第四步:维护
模块坏了能不能现场更换?
故障定位在模块、主机、交换芯片还是封装里?
第五步:供应链
光源、DSP、FAU、MPO、硅光PIC、测试设备谁卡住?
用这棵树,可以避免两个极端:
- 把成熟可插拔模块过早判死刑。
- 把CPO/NPO等远期路线完全忽略。
更稳妥的研究方式是把技术路线分成三类:
| 类型 | 代表 | 研究方式 |
|---|---|---|
| 当前兑现 | 可插拔800G/1.6T、部分硅光可插拔 | 看出货、ASP、毛利率、客户认证 |
| 过渡优化 | LPO/LRO/TRO、AOC/AEC、短距铜互联 | 看客户试点、互通性、故障定位 |
| 远期重构 | NPO、CPO、光I/O、OCS | 看标准、生态、封装、维修和真实订单 |
20. 公司分析框架
光模块公司不能只按“有没有光模块”分类。建议按五层读。
20.1 第一层:它卖什么
| 卖的东西 | 说明 | 研究重点 |
|---|---|---|
| 整模块 | 直接卖给云厂商、交换机厂、设备厂 | 速率、客户、交付、物料、毛利 |
| 光源/光芯片 | 卖EML、CW、VCSEL、DFB、探测器等 | 速率、良率、客户认证、产能 |
| 无源光器件 | FAU、MPO、透镜、滤波、WDM等 | 精度、专利、良率、路线无关性 |
| 电芯片 | DSP、Driver、TIA、CDR等 | 200G/lane、功耗、替代风险 |
| 光纤/连接布线 | 光纤、预端接、连接器组件 | 是否进入数据中心高密度链条 |
| 系统客户 | GPU、交换机、云厂商 | 决定规格,不一定直接捕获模块利润 |
20.2 第二层:它处在哪个速率阶段
同样是光模块,400G、800G和1.6T不是同一个竞争状态。公司如果只在低速或电信侧强,不能直接映射到AI数通高端链条。
20.3 第三层:它有没有客户认证
光模块不是做出来就能卖。头部客户通常要看产品稳定性、长期可靠性、兼容性、供货能力和故障响应。投资研究中最容易缺的不是“有没有样品”,而是“有没有通过核心客户认证并持续出货”。
20.4 第四层:它有没有物料控制力
模块厂的利润不只来自出货量。EML、CW光源、DSP、Driver、TIA、FAU、连接器和测试资源如果紧缺,谁能拿到料、谁能控制成本、谁能顺利交付,差异会很大。
20.5 第五层:它的收入纯度如何
多业务公司尤其要看收入纯度。公司名字里有“光”“通信”“连接”,不等于它的收入来自AI数据中心800G/1.6T。没有收入纯度,就很难做公司排序。
21. 负面覆盖怎么写
负面覆盖不是说公司一定不好,而是说“它当前不属于本专题核心节点”。光模块专题里常见负面覆盖有四类:
| 类型 | 例子 | 为什么要排除或降级 |
|---|---|---|
| 普通光纤光缆 | 传统通信光纤、运营商光缆 | 和800G/1.6T模块价值捕获不同 |
| 泛连接器 | 普通电连接、普通光连接 | 需要证明高密度MPO/数据中心客户 |
| 泛光芯片 | 工业激光、激光雷达、低速通信 | 不等于高端数通EML/CW |
| 远期概念 | CPO、硅光、OCS小作文 | 需要真实产品、客户和时间表 |
负面覆盖表要写清楚复查条件。例如“如果公司披露800G/1.6T客户认证、批量出货或高密度MPO产品收入,再重新评级”。这样排除不是主观否定,而是证据等级管理。
22. 初学者练习题
读完本专题后,可以用下面问题自测:
- 为什么AI训练集群比传统互联网业务更依赖高速网络?
- 光模块为什么不是单一零件,而是光、电、热、机械和软件的小系统?
- 800G和1.6T的难点分别在哪里?
- EML和CW光源分别在什么场景下重要?
- 硅光为什么不是“不要光源”?
- 可插拔、LPO、NPO、CPO为什么不能简单判断谁消灭谁?
- 为什么FAU/MPO可能成为路线无关节点?
- 为什么普通光纤公司不能直接按高端光模块逻辑估值?
- 判断一家A股公司是否真的受益,需要哪些数据?
- 哪些结论现在还只能算假设,不能写成事实?
如果这些问题能答出来,说明已经从“听名词”进入“读产业”的阶段。下一步就可以开始补公司年报、公告和客户认证资料。
23. 逐模块学习地图
从这一章开始,把前面的框架拆成八个学习模块。你可以把它当成以后所有科技专题的通用读法:先确定需求从哪里来,再看系统如何消化需求,再拆产品、BOM、制造、路线、公司和数据。这样做的好处是,不会被单个名词牵着走,也不会把投资材料里的某一句观点当成行业全貌。
| 学习模块 | 要回答的核心问题 | 光模块专题里的对应内容 |
|---|---|---|
| 需求模块 | 为什么这个东西被需要,需求从哪里传导过来 | AI集群、GPU数量、交换机端口、Capex结构 |
| 网络模块 | 系统怎么组织,哪些链路必须连接 | scale-out、scale-up、以太网、InfiniBand、机柜内/机柜间 |
| 产品模块 | 客户实际买的是什么规格 | 400G、800G、1.6T、DR/FR/LR、OSFP、QSFP-DD |
| BOM模块 | 产品由哪些关键部件组成 | DSP、Driver、TIA、EML、CW、硅光PIC、FAU、MPO、散热 |
| 制造模块 | 为什么做出来和稳定量产是两回事 | 耦合、封装、测试、良率、可靠性、客户认证 |
| 路线模块 | 不同技术路线分别解决什么矛盾 | 可插拔、LPO/LRO/TRO、硅光、NPO、CPO、OCS |
| 公司模块 | 每家公司到底在哪一层捕获价值 | 模块厂、光源厂、无源器件厂、DSP厂、系统客户、负面覆盖 |
| 数据模块 | 哪些结论还不能写死 | 出货量、ASP、客户时间表、物料份额、收入纯度 |
阅读顺序不建议从公司开始。初学者如果先看公司,很容易把“哪个公司涨得多”误认为“哪个公司产业位置最好”。更稳妥的读法是:先把需求和系统讲清楚,再看产品和BOM,最后把公司放回产业链。
24. 需求模块:从AI工作负载到光模块数量
需求模块要解决的问题是:为什么AI数据中心需要更多、更快、更贵的光互联。这里不能停留在“AI需求很大”这一句,因为这句话无法帮助你判断哪类公司受益,也无法区分真实需求和概念扩散。
AI集群里的数据交换主要来自三类任务。第一类是训练时的参数同步和梯度交换,很多GPU需要反复通信;第二类是推理服务中的多节点协同,尤其当模型、上下文长度和并发请求增大后,服务器之间的数据移动也会上升;第三类是存储、检查点、调度和故障恢复,虽然不总是被市场放在第一位,但在大型集群中同样消耗网络能力。
需求传导可以这样拆:
模型规模/推理流量
-> GPU或AI ASIC数量
-> 服务器数量和机柜数量
-> 交换机层级和端口数量
-> 每个端口需要的速率
-> 光模块、铜缆、AOC、连接器和布线
-> 光源、DSP、FAU/MPO、测试封装等上游需求
这个链条里最重要的不是某一个数字,而是“单位算力需要多少网络”。同样是增加GPU,如果网络架构更省链路,光模块需求可能没有线性增长;如果从400G切到800G或1.6T,模块单价、上游物料和制造难度又会变化。因此研究需求时要把“数量”和“规格”同时看。
分析需求模块时,建议每次都问五个问题:
- 这批AI集群是训练为主,还是推理为主?
- 用什么网络架构,是以太网、InfiniBand,还是客户自定义互联?
- 每一代GPU/ASIC平台对应什么交换机速率和端口密度?
- 端口连接用光模块、铜缆、AOC,还是混合方案?
- 采购节奏是一次性建设、分批交付,还是受库存和认证影响?
常见误区是把云厂商总Capex直接等同于光模块收入。Capex里有GPU、服务器、电力、散热、土地、建筑、交换机、存储和软件,光模块只是其中一层。更细的研究应该拆AI网络Capex,再拆光互联,再拆模块与上游器件。
本模块的数据缺口包括:头部客户AI网络Capex占比、每代平台端口配置、单GPU对应光模块数量、800G/1.6T采购节奏、铜互联替代比例、库存周期和客户认证时间。
25. 网络模块:先分清scale-out和scale-up
网络模块要解决的问题是:光模块到底服务哪一种连接。很多技术路线争论看起来很复杂,本质上是因为大家把不同网络场景放在一起讨论。
scale-out可以理解为横向扩展:很多服务器、很多机柜、很多交换机组成一个大集群。它强调可扩展、可维护、可采购、可替换。传统可插拔光模块在这里有很强的生态优势,因为模块坏了可以换,供应链成熟,交换机和光模块可以分工演进。
scale-up可以理解为更紧密的计算域互联:在较小范围内追求更高带宽、更低延迟和更低功耗。这里对连接距离、延迟、功耗和密度更敏感,因此更容易出现NPO、CPO、光引擎、光I/O等讨论。但它并不意味着传统可插拔立刻消失,而是说明系统架构中出现了新的优化方向。
还要分清距离:
| 距离层级 | 典型连接 | 研究重点 |
|---|---|---|
| 板内/板间 | 芯片附近、高速电互联、未来光I/O | 信号损耗、封装、热管理、可维修性 |
| 机柜内 | GPU服务器、交换机、短距连接 | 铜缆、AEC、AOC和短距光的成本功耗比较 |
| 机柜间/数据中心内 | 交换机之间、服务器到交换机 | 800G/1.6T可插拔、DR/FR、光源和连接器 |
| 数据中心间 | DCI、城域、长距传输 | 相干光、长距模块,不要和AI集群内部混看 |
网络模块的分析重点是“链路地图”。你不需要一开始就画出完整数据中心拓扑,但至少要知道每类连接的距离、带宽、功耗和可维护要求。产品规格和技术路线都要回到这张链路地图上解释。
常见误区是把CPO当作“所有光模块的终局”。更准确的说法是:CPO试图解决极高带宽密度下的功耗和信号损耗问题,但它会引入维修、良率、封装、热管理和生态迁移问题。它更像系统架构重构的一种候选,而不是对所有可插拔模块的短期替换。
本模块的数据缺口包括:头部客户不同网络层级的端口数量、scale-out和scale-up的光互联用量差异、铜缆/AOC/光模块分工、交换机平台代际、NPO/CPO真实导入时间表。
26. 产品模块:把产品名拆成可研究的句子
产品模块要解决的问题是:客户实际买的是什么。光模块行业的名词很多,初学者容易被800G DR8 OSFP、1.6T FR4、LPO、硅光这些词吓住。其实可以统一拆成一句话:
总速率是多少,用几条lane实现,传多远,插在什么封装里,采用什么光学/电学方案,是否已经量产认证。
以800G DR8 OSFP为例,不要只看到800G。它至少包含五个问题:800G是总带宽;DR说明距离规格;8说明可能涉及多通道并行;OSFP说明封装形态;真正的研究还要问它用EML、硅光还是其他方案,用不用DSP,功耗多少,客户是谁,量产到什么阶段。
产品模块最重要的四个维度是:
| 维度 | 问题 | 为什么影响研究 |
|---|---|---|
| 速率 | 400G、800G、1.6T还是更高 | 决定产品代际和上游物料难度 |
| lane | 100G/lane还是200G/lane | 决定电芯片、光源、测试和良率压力 |
| 距离 | SR、DR、FR、LR、ZR | 决定光源、调制、接收和应用场景 |
| 封装 | OSFP、QSFP-DD、AOC、未来NPO/CPO | 决定端口密度、散热和可维护性 |
分析产品模块时,最容易犯的错是把“样品发布”当成“产业地位”。样品说明公司可能具备研发能力,但投资研究和产业研究更关心客户认证、批量交付、良率、物料成本、ASP和售后稳定性。尤其是1.6T,不能因为产品页出现了1.6T字样,就默认公司已经获得同等收入和利润。
产品模块还要和公司模块相连。模块厂的产品线越完整,越可能覆盖不同客户规格;光源厂要看它的EML或CW是否匹配高速产品;无源器件厂要看它的FAU/MPO是否进入高密度产品;DSP厂要看它的芯片是否支持下一代lane速率。
本模块的数据缺口包括:各公司800G/1.6T产品规格、是否送样/认证/量产、对应客户、功耗、主要BOM、ASP区间、产品毛利率和新老产品切换节奏。
27. BOM模块:一只模块不是一个零件
BOM模块要解决的问题是:光模块的价值和难度到底藏在哪些部件里。把光模块看成一个盒子,会错过真正的产业分工;把每个部件孤立看,又会看不懂它们为什么互相制约。
一只高速光模块大致可以分成六组部件:
- 电信号处理:DSP、CDR、Retimer、Driver、TIA。
- 光发射:EML、CW激光器、调制器、硅光PIC。
- 光接收:PD、TIA、接收端模拟链路。
- 无源光学:FAU、透镜、滤波、WDM、MPO、LC、SN等。
- 机械热管理:壳体、散热、屏蔽、结构件。
- 固件测试:监控、诊断、兼容性、产线测试和可靠性验证。
这些部件不是简单相加。DSP可以提高链路稳定性,但会增加功耗和成本;LPO试图减少模块侧DSP,却把难度转移到主机侧、链路调试和互通性。硅光可以提高集成潜力,但仍然要依赖CW光源、耦合封装和测试。FAU/MPO本身不产生光,却可能影响高密度连接的良率和可靠性。
BOM模块要特别关注“路线无关节点”。如果一个部件在可插拔、硅光、NPO、CPO中都可能被用到,它就比单一路线叙事更值得长期跟踪。例如高可靠光源、精密耦合、FAU、高密度连接、测试设备可能在多条路线里都重要,只是用量、形态和客户不同。
常见误区是把某个部件的概念外延放得过大。比如“激光芯片”不等于“高端数通EML/CW”;“连接器”不等于“高密度MPO/MTP”;“光纤”不等于“AI高价值光模块瓶颈”;“硅光”不等于“所有传统光学部件都被替代”。
本模块的数据缺口包括:核心BOM成本占比、光源/DSP/FAU/MPO供应份额、国产替代进度、关键物料交期、物料涨跌价、模块厂物料自供比例和不同路线下BOM结构变化。
28. 制造模块:样品、认证、量产是三件事
制造模块要解决的问题是:为什么“能做出来”和“能持续交付”差别很大。高速光模块是光、电、机械、热和软件的综合系统,量产难点往往不在一句技术名词里,而在长期稳定的一致性。
制造环节可以按五步理解:
关键芯片和器件准备
-> 光电封装和耦合
-> 模块组装和热设计
-> 高速测试和老化验证
-> 客户认证和规模交付
光电耦合是制造里很关键的一环。光纤、FAU、透镜、光芯片或硅光PIC之间需要非常精确地对准,偏差会带来损耗、良率下降和可靠性问题。速率越高、通道越多、封装越紧凑,这个问题越难。
测试同样重要。高速模块要看误码率、眼图、功耗、温度、长期稳定性、兼容性和批次一致性。1.6T阶段,测试时间、测试设备、测试成本和良率都会影响公司交付能力。客户认证则像最后一道门槛:模块在自家实验室跑通,不等于能在客户系统里长期稳定运行。
制造模块和公司分析直接相关。模块厂要看良率、交付、客户认证和售后;设备厂要看封装测试设备是否进入真实产线;无源器件厂要看精密制造和自动化;光芯片厂要看外延、芯片良率和可靠性。
常见误区是只看发布会或展会样品。展会样品适合证明方向,但不能证明收入质量。真正影响财务的是批量订单、良率爬坡、成本下降、售后稳定和客户复购。
本模块的数据缺口包括:各公司量产阶段、客户认证状态、良率、测试瓶颈、扩产节奏、设备采购、可靠性指标、退货率和单位制造成本。
29. 路线模块:每条路线都是在取舍
路线模块要解决的问题是:不同技术路线到底在解决什么矛盾。不要把路线当成口号,也不要急着问谁是终局。更好的问法是:这条路线牺牲了什么,换来了什么,适合哪个时间和场景。
| 路线 | 主要想解决的问题 | 主要代价 |
|---|---|---|
| 可插拔DSP模块 | 成熟生态、可维护、稳定传输 | 功耗和成本压力上升 |
| LPO/LRO/TRO | 降低模块侧功耗和BOM | 主机侧要求更高,互通和故障定位更复杂 |
| 硅光可插拔 | 提高集成度,改善规模制造潜力 | 依赖CW光源、耦合、良率和封装 |
| NPO | 让光引擎更靠近交换芯片,降低电传输损耗 | 生态、散热、维修和标准仍需成熟 |
| CPO | 光学与交换芯片共封装,追求系统级低功耗高密度 | 维修、良率、封装、测试和供应链重构难度高 |
| OCS | 用光交换改善网络调度或降低部分电交换压力 | 架构复杂,是否增量要看客户网络设计 |
路线研究要把时间分层:当前兑现、过渡优化、远期重构。当前兑现看订单和收入;过渡优化看客户试点和互通性;远期重构看标准、生态、工程约束和真实路线图。把远期路线当短期收入,会高估相关公司;完全忽略远期路线,又会错过价值链迁移。
路线模块还要反向映射BOM。比如LPO如果减少模块侧DSP,可能影响DSP价值,但会提高主机侧调试和系统责任;硅光如果增加CW光源需求,就要看光源厂和耦合封装;CPO如果靠近交换芯片,就要看交换芯片厂、光引擎、FAU、封装和测试。
常见误区有两个极端:一个是“可插拔马上被淘汰”,另一个是“远期路线都是故事”。教材口径应当介于两者之间:可插拔仍是短中期重要主线,远期路线必须跟踪,但要分场景、时间和证据等级。
本模块的数据缺口包括:头部客户路线时间表、LPO试点结果、硅光量产良率、NPO/CPO标准与生态、OCS实际部署案例、各路线对光源/DSP/FAU/MPO/测试设备的用量变化。
30. 公司模块:把标的变成产业角色
公司模块要解决的问题是:每家公司到底凭什么和本专题相关。这里不要先按市场热度排序,而要先按产业角色排序。
第一层是核心模块厂。它们直接面对800G/1.6T需求,价值来自产品设计、物料管控、客户认证、良率和规模交付。研究它们时,重点不是“有没有高速模块”,而是产品是否被客户认证,是否稳定量产,物料是否顺畅,毛利率是否能维持。
第二层是光源和光芯片。它们可能是高速模块和硅光路线的重要瓶颈,但要严格区分电信侧、接入侧、工业激光和高端数通。只有进入800G/1.6T、EML、CW光源或硅光供应链,才算和本专题强相关。
第三层是无源光器件。FAU、MPO、透镜、滤波、WDM等容易被低估,因为它们不如芯片名词显眼。但在高密度光互联里,对准精度、低损耗、可靠性和批量一致性可能非常关键。
第四层是电芯片和系统芯片。DSP、Driver、TIA、交换芯片会决定产品速率和路线演进。海外大公司往往业务很大,读它们更多是为了理解规格和供应链,而不是简单映射成“光模块标的”。
第五层是系统客户和设备厂。GPU、交换机、云厂商决定需求和规格,但它们本身不是光模块公司。研究它们是为了理解需求传导、客户路线和采购节奏。
第六层是边缘相关和负面覆盖。普通光纤、泛连接器、传统电信光模块、工业激光和只有概念的公司,都需要写清楚为什么当前不放在核心位置。负面覆盖不是否定公司,而是防止研究边界被概念稀释。
公司模块建议使用统一分析框架:
- 它卖什么:模块、光源、无源器件、电芯片、设备、材料、系统,还是只是概念相关?
- 卖给谁:云厂商、模块厂、交换机厂、运营商,还是非数据中心客户?
- 用在哪:800G/1.6T、硅光、CPO/NPO、普通电信、工业或消费?
- 证据是什么:产品页、公告、年报、客户认证、收入、订单还是市场传闻?
- 收入纯度多少:相关业务占总收入多少,是否足以影响财务?
- 风险在哪里:技术路线变化、客户集中、ASP下行、物料紧缺、认证失败还是概念错配?
本模块的数据缺口包括:公司高端数通收入占比、客户认证、产品规格、毛利率、关键物料来源、订单能见度、份额、负面覆盖复查条件。
31. 数据模块:把未知保留下来
数据模块要解决的问题是:哪些结论现在还不能下。成熟的研究不是把所有空白都填成判断,而是把空白标出来,告诉自己下一步怎么补。
光模块专题最重要的数据可以分成四层:
| 优先级 | 数据 | 为什么重要 |
|---|---|---|
| P0 | 800G/1.6T出货量、ASP、客户结构、公司收入纯度 | 不补就无法判断主链是否成立 |
| P1 | 光源/DSP/FAU/MPO供需、200G/lane良率、产品认证 | 决定瓶颈、份额和盈利质量 |
| P2 | 铜互联替代、OCS增量、国内外规格差异、连接布线价值量 | 决定边缘节点和路线分歧 |
| P3 | 标准术语、远期3.2T、光I/O、更多供应商细节 | 决定后续下钻,但不影响当前主线 |
数据模块还要区分事实、假设和推论。事实是可以直接找到证据的,例如公司产品页、公告、财报、标准说明。假设是合理但尚未完全证实的判断,例如“某类FAU可能具备路线无关属性”。推论是从事实和假设推出来的结论,例如“如果硅光放量,CW光源和耦合封装的重要性提高”。三者不能混写。
补数据时,优先级不要被市场热度左右。先补P0,再补P1。比如“某公司是不是核心标的”看起来很急,但如果没有它的高端数通收入纯度和客户认证,结论就只能停留在待验证。
本模块的常见误区是把缺口当成结论。例如“公司有光芯片”不能自动推出“公司受益800G”;“云厂商Capex增加”不能自动推出“所有光通信公司收入增加”;“CPO是方向”不能自动推出“所有CPO概念公司都受益”。
数据模块下一步要形成三张表:产品规格表、公司证据表、路线时间表。产品规格表解决“买的是什么”;公司证据表解决“谁真的参与”;路线时间表解决“什么时候兑现”。
32. 读完本专题后应该形成的能力
这份教材不是为了让你背名词,而是为了让你能独立拆一个科技专题。读完后,至少应该形成四种能力。
第一,能把需求传导讲清楚。你应该能从AI工作负载讲到GPU集群,再讲到交换机端口、链路数量、光模块速率和上游物料,而不是只说“AI拉动光模块”。
第二,能把产品名拆开。看到800G、1.6T、DR、FR、OSFP、QSFP-DD、LPO、硅光时,你不需要马上知道所有细节,但要知道应该继续问哪些问题。
第三,能把公司放回产业角色。看到一家公司时,先判断它是模块、光源、无源器件、电芯片、光纤、设备、系统客户,还是负面覆盖对象,再决定该用什么证据验证它。
第四,能把未知写成清单。研究不是装作什么都知道,而是把关键数据缺口放在台面上,一项一项补。只要能持续维护数据缺口,这个专题就会越来越像一套可复用的行业研究系统。
下一版建议优先补三类内容:第一,800G/1.6T产品规格表;第二,核心公司证据卡;第三,光源、DSP、FAU/MPO三个上游瓶颈的单独下钻页。