1.2 光的基础
一提到光,人们会立刻联想到太阳光和电灯光。光是一种电磁波,太阳光和电灯光可以被看成波长在可见光范围内的电磁波的混合体。与此相反,光纤通信使用的激光器发出的光则是单色光,具有极窄的光谱宽度。点光源是只有几何位置而没有大小的光源。在自然界,理想的点光源是不存在的,但是对于均匀发光的小球体,如果它本身的大小和它到观察点的距离相比小得多,我们就可以近似地把它看成点光源。激光器发出的光也可以看成点光源。光线是光向前传播的一条类似几何线的直线。把有一定关系的一些光线的集合称为光束。
1.2.1 光的本质——波动性和光子性
光具有两种特性,即波动性和光子性[13],下面分别加以介绍。
1. 光的波动性
1864年,麦克斯韦(Maxwell)通过理论研究指出,和无线电波和X射线一样,光是一种频率很高的电磁波,是电磁波谱的一个组成部分。电磁波频率与波长的换算如图1.2.1所示。单频光称为单色光。光纤通信使用850~1 550nm的近红外线,具有反射、折射、衍射、干涉和衰减等特性。
图1.2.1 电磁波频率与波长的换算
1888年,德国物理学家赫兹首先用人工的方法获得了电磁波,并且通过电谐振接收到它,这就证实了电磁波的实际存在。后来又通过实验发现,电磁波在金属表面上要反射,在金属凹面镜上反射后会聚焦,通过沥青棱镜时要发生折射等现象,从而证实了电磁波在本质上跟光是一样的。
1891—1893年,科学家们分别用实验的方法测出了电磁波的传播速度,它和光的传播速度近似相等。
利用光的波动性可解释光的反射、折射、衍射、干涉和衰减等特性。利用光的反射、折射又可以解释多模光纤传输光的原理,利用光的衍射和干涉又可以解释许多光纤通信器件如滤波器、复用/解复用器、光调制器、激光器和半导体光放大器(Semiconductor Optical Amplifiers,SOA)等的工作原理。
在均匀介质中,可用麦克斯韦波动方程弱导近似形式描述,即
式中,▽2是二阶拉普拉斯运算符;υ是在均匀介质中的波速;E和H分别是电场和磁场。
光波可以用频率(波长)、相位和传播速度来描述。频率是每秒传播的波数,波长是在介质或真空中传输一个波(波峰-波峰)的距离。频率用Hz、MHz、GHz或THz表示,波长用μm或nm表示。
【例1.2.1】“1”码内的光振荡数量
用脉冲信号对光强调制,使用波长为0.82μm的LED,请问当脉冲宽度为1ns时,在“1”码时有多少个光振荡?
解:已知λ=0.82μm,所以光频率f=c/λ≈3.6585×1014Hz,光周期T=1/f=2.7334×10-15s。已知脉冲宽度为1ns,所以在该脉冲宽度内的光振荡(周期)数是
N=Tele/T=10-9/(2.7334×10-15)≈365 845
2. 光的光子性
利用光的波动性可以解释很多现象,但是很多时候光的行为并不像一个波,而更像是由许多微粒组成的集合体,这种微粒称为光子,这种假设由爱因斯坦1905年在普朗克量子概念的基础上提出。单色光的最小单位是光子,光子能量可以描述为
式中,h是普朗克常量,单位焦耳·秒(J·s);ν是光子频率。光子能量E与它的频率ν成正比,光子频率越高,光子能量越大。光子能量用电子伏特(eV)表示,1eV就是一个电子电荷经过1V电位差时,电场力所做的功。
像所有运动的粒子一样,光子与其他物质碰撞时也会产生光压。光也是一种能量的载体,当光子流打到物质表面上时,它不但要把能量传递给对方,也要把动量传递给对方,而且也遵守能量守恒定律和动量守恒定律。为了验证上述说法的正确性,可用如图1.2.2所示的光电效应实验装置进行实验。在一个抽成真空的玻璃容器内,装有阳极A和金属锌板的阴极K。两个电极分别与电流计G、伏特计V和电池组连接。当光子照射到阴极K的金属表面时,它的能量被金属中的电子全部吸收,如果光子的能量足够大,大到可以克服金属表面对电子的吸引力,电子就能跑出金属表面,在加速电场的作用下,向阳极A移动而形成电流,这种现象就称为光电效应。实验表明,使用可见光照射时,无论光强多么大,照射时间多么久,电流计中总是没有电流;但使用紫外线照射时,无论光强多么微弱,照射时间多么短暂,电流计中总是有电流,说明金属板上有电子跑出来。这是因为可见光的频率低,光子能量小,小于锌的电子溢出功;而紫外线的频率高(见图1.2.1),光子能量大,大于锌的电子溢出功。由于爱因斯坦利用光量子概念,从理论上成功地解释了光电效应现象,因此他于1912年获得了诺贝尔物理学奖。
图1.2.2 光电效应实验装置
1936年实验证明,当双折射晶片内产生圆偏振光时,这个晶片会经受着反作用的转矩。
光在不同的介质中具有不同的传播速度,在真空中它以最大的速度直线传播,光子能量可用爱因斯坦方程描述,即
式中,m是光子质量,单位为kg;c是光速,单位为km/s。频率ν、波长λ和光速c的关系为
用它可进行电磁波频率与波长的换算。图1.2.1中标出了光通信所用到的波段。
从式(1.2.2)和式(1.2.3)可以得到ν=mc2/h和m=hν/c2。光的传播特性如图1.2.3所示。当光通过强电磁场时,由于相互作用,它的运动轨迹要改变方向,电磁场越强,改变越大,如图1.2.3(a)所示。当光通过比真空密度大的介质时,光传播速度要减慢,如图1.2.3(b)所示,其减慢的程度与介质折射率n成反比,即式(1.2.1)中的波速变为
v=c/n
图1.2.3 光的传播特性
式中,是真空中的光速,c=3×108m/s,ε0为真空介电常数,μ0是真空磁导率;为介质折射率。
光的光子性可以用来度量光接收机灵敏度,例如,“0”码不携带能量时,用每比特接收的平均光子数表示光接收机灵敏度,它的使用相当普遍,特别是在相干通信系统中,光探测器的量子极限是10,即。但大多数光接收机实际工作的远大于量子极限,通常。
【例1.2.2】光探测器每秒接收的光子数
0.8μm波长的光以1μW的光功率入射到光探测器上,请问光探测器每秒接收的光子数是多少?
解:从式(1.2.2)和式(1.2.4)可知,一个0.8μm波长的光子能量是
E=hν=hc/λ≈2.48×10-19J
因为光功率是单位时间产生的能量,所以1s产生的能量E=Pt,1μW的光功率在1s的时间间隔内就产生1μJ的能量。该能量可产生的光子数是
如果时间从1s减少到1ns,我们仍然可以接收到4000个光子,7.5节介绍的相干光接收机NP<100是很容易实现的,而普通光接收机NP>1 000。
1.2.2 均匀介质中的光——光是电磁波
1. 平面电磁波
光是一种电磁波(Electromagnetic Wave)。电磁波是行波,它的电场Ex和磁场Hy随时间不断变化,在空间沿着z方向总是相互正交传输的。作为行波电磁波的光的传输如图1.2.4所示。最简单的行波是正弦波,沿z方向传输的数学表达式为
式中,Ex是随时间t在z方向传输的电场;Eo是波幅;ω是角频率;k是传输常数或波数,k=2π/λ,这里λ是波长;?o是相位常数。考虑到在t=0和z=0时,Ex可以是零也可以不是零,这要由起点决定。(ωt-kz+?o)称为波的相位,用?表示。式(1.2.5)描述的是沿z方向无限传播的单色平面波。在任一垂直于传播方向z的平面上,由式(1.2.5)可知波的相位是个常数,也就是说在这一平面上电磁场也是个常数,该平面称为波前。平面波的波前很显然是与传播方向正交的平面。沿z方向传播的平面电磁波在指定平面上的任一点具有相同的Ex或Hy,所有电场在xy平面同向,如图1.2.5所示[1][4]。
图1.2.4 作为行波电磁波的光的传输
图1.2.5 沿z方向传播的平面电磁波在指定平面上的任一点具有相同的Ex或Hy,所有电场在xy平面同向
由电磁理论可知,随时间变化的磁场总是产生同频率随时间变化的电场(法拉第定律),同样,随时间变化的电场也总是产生同频率随时间变化的磁场,因此电场和磁场总是以同样的频率和传播常数(ω和k)同时相互正交存在,如图1.2.4所示。所以,也有与式(1.2.5)表示的Ex类似的磁场Hy行波方程。通常,我们用电场Ex描述光与非导电材料(介质)的相互作用,今后,凡提到光场就是指电场。我们也可以用指数形式描述行波,因为cos?=Re[exp(j?)],这里Re指的是实数部分。于是式(1.2.5)可以改写为
式中,Ec=Eoexp(j?o)表示包括相位常数?o的波幅。
在图1.2.5中,波前沿矢量k传播,k称为波矢量,它的幅度是传播常数,即k=2π/λ,显然它与恒定的相平面(波前)垂直。波矢量k可以是任意方向的,并可以与z方向不一致。
在时间间隔δt内,波前移动了δz,因此该波的相速度是δz/δt。于是相速度为
式中,ν是频率(ω=2πν)。
假如波沿着z方向沿波矢量k传播,被Δz分开的两点间的相位差Δ?可用kΔz简单表示,假如相位差是0或2π的整数倍,则两个点是同相位的,于是相位差Δ?可表示为[4]
我们经常对光在给定时间被一定距离分开的两点间的相位差感兴趣,如光的干涉和衍射、由马赫-曾德尔干涉仪构成的滤波器、复用/解复用器和调制器,由阵列波导光栅构成的诸多器件(滤波器、波分复用/解复用器、光分插复用器和波长可调/多频激光器等),以及由电光效应制成的外调制器和由热光效应制成的热光开关等,它们的工作原理均用到这一相位差的概念,本书以后有关章节也会经常用到这一概念,并使用式(1.2.8)。
2. 麦克斯韦波动方程
电磁波的种类如图1.2.6所示。图1.2.6(a)表示沿z方向传播的平面波,它所有恒定的相位面都是与z方向垂直的xy平面。它是平行于z方向的平面波,与z方向成直角的平行浅色线表示波前,通常波前用相位2π或一个波长λ来分开。波矢量k是波前表面P点的法线,它表示波从P点传播的方向,显然,每一点的传播矢量都是平行的。平面波的幅度Eo与参考点的距离无关,在垂直于k的同一平面上的所有点都相同,即与x和y无关。而且,在平面波中,当这些平面扩展到无限远时,其能量也能保持不变。这是理想的平面波,在分析许多电磁波现象中是很有用的,但实际是不存在的。
实际上,有许多种类的电磁波,它们必须遵守描述电场的时间和空间的有关波动方程。在均匀和线性介质中,即相对介电常数(εr)在所有方向都相同(即与电场无关),电场E必须遵守麦克斯韦波动方程,即
式中,μo是介质的绝对(真空)磁导率,εo是介质的绝对(真空)介电常数,εr是介质的相对介电常数。式(1.2.9)假定介质的电导率为零。为了找出电场的时间和空间的关系,我们必须利用初始和边界条件对式(1.2.9)求解,结果表明,式(1.2.5)描述的平面波满足式(1.2.9),另外许多种类的电磁波也满足式(1.2.9)。
图1.2.6 电磁波的种类[4]
球面波是一种从电磁波的波源发出的传播波,如图1.2.6(b)所示,它的幅度随着从源头开始的距离r的增大而衰弱,距源头r的任一点的电场为
式中,A是常数。把式(1.2.10)代入式(1.2.9),结果表明,式(1.2.10)是麦克斯韦波动方程的一个解。
图1.2.6(c)所示的是一种接近实际的扩散波。光扩散是指在给定的波前上,波矢量分开的角度,球面波有360°的光扩散。平面波和球面波表示波传输的极端情况,它们完全平行于扩散波矢量,平面波的波源无限大,而球面波的波源是点光源。在许多光学解释中,在离光源很远的一个很小的区域内,波前将接近平面,尽管它实际上是一个球面,图1.2.6(a)所示的平面波是巨大球面的一个极小部分。
许多光束,如激光器的输出可用高斯光束来描述。沿z方向传播的高斯光束如图1.2.7所示。该光束的传输特性仍然可用exp j(ωt-kz)描述,但是它的幅度不但以光束轴线为中心在空间变化,而且从源头开始向外辐射时也在变化。这种光束与图1.2.6(c)所示的扩散波类似,即沿z方向任一点光束横截面的分布都是高斯分布。定义z方向上任意一点的光束直径为2w,该点光束横截面积为πw2,包含了85%的光束功率,w称为模场半径,高斯光束光强分布为
图1.2.7 沿z方向传播的高斯光束[4]
式中,e是自然对数,e0=01;I0是r=0时的光强。于是,2w随光束沿z方向传播时增大。
高斯光束以有限的宽度2wo从O点开始,沿z方向传播时光束逐渐扩散,波前也由平行变成弯曲。波前平行的地方,宽度为2wo,称为光束的收敛,wo是收敛半径,2wo是光斑尺寸。光束直径随距离z线性增加,2θ称为光束的扩散角。光束的收敛半径越大,其扩散角越小,即
该式定义了高斯光束可以聚焦的最小光斑尺寸。
【例1.2.3】扩散角
考虑一个波长为633nm的He-Ne激光器,光斑尺寸为10mm,假设它发出的光束是高斯光束,问光束的扩散角是多少?
解:根据式(1.2.11)可得
1.2.3 相速度和折射率
1. 介电常数、各向同性、各向异性
当电磁波在介质中传播时,振荡的电场以其波动频率极化介质的分子,产生分子偶极子。可以认为,电磁波传播是该极化在介质中的传播,电场和它引入的分子偶极子共轭存在。极化机理使电磁波在介质中传播要比在真空中传播延迟了一段时间。电磁波在介质中传播时,电场和它产生的分子偶极子相互作用的程度可用相对介电常数εr表示。当电磁波在相对介电常数εr的非磁介电质中传播时,其相速度为
假如电磁场的频率是在光频率范围内的,电场产生的介质极化是离子极化,它要比分子极化慢一些,相速度也更慢一些。对于在自由空间传播的电磁波,εr=1,真空中的光速。介质折射率n是光在自由空间的速度与它在介质中的速度之比,即
由此可见,介质折射率n与材料的介电常数εr有关。
假如k是自由空间波矢量(其幅值为‖k‖=2π/λ),λ是自由空间波长,介质中的波矢量kd和波长λd分别为kd=nk和λd=λ/n,所以光在介质中的波长要比在真空中的短一些,但其频率仍相同。由式(1.2.13)可知,由于光在密集介质中传输更慢,所以具有较大的介质折射率。在非晶体材料(如玻璃和液体)中,材料结构在所有方向都相同,n与方向无关,称为各向同性(Isotropic)折射率晶体,如非结晶固体玻璃、液体和立方晶体。然而,在晶体中,原子的排列和原子间的结合在不同的方向是互不相同的,这种晶体具有各向异性(Anisotropy)特性,相对介电常数εr在不同的晶体方向也互不相同,所以介质折射率n在不同的晶体方向是互不相同的,在图1.2.4中,假设电场沿着x方向振荡的电波在晶体中沿着z方向传输,x方向的相对介电常数是εrx,此时,因此电波传输的相速度υc=c/nx。除了立方晶体(如宝石)外,所有的晶体都表现出不同程度的各向异性,从而产生了一些重要的应用,如1.3.6节、3.11节介绍的双折射效应和3.5.1节介绍的电光效应及其应用。
2. 相速度、群速度
现在考虑传输模中的一条光线,光线在纤芯内以角度θ全反射,在介质中的光速υ=c/n1,它是波矢量k传播的速度,称为相速度。我们可以把电场E和波矢量k分解成两个沿波导(z轴)的传输常数β和k,β传播的速度vg=vcosθ,称为群速度。阶跃光纤波导的波矢量k、传输常数β、相速度υ、群速度υg如图1.2.8所示。
图1.2.8 阶跃光纤波导的波矢量k、传输常数β、相速度v、群速度vg
由于光纤的纤芯形状沿长度难免出现变化,光纤也可能受非均匀应力而使圆柱对称性受到破坏,两个模式的传播常数βx≠βy,所以光纤波导是一种各向异性介质波导,也存在双折射,使光纤正交偏振兼并的特性受到破坏,而产生偏振模色散(见2.3.2节)。
1.2.4 群速度和群折射率
因为实际中并不存在纯单色光,所以我们必须考虑波长略不相同的一组光沿同一方向传输的情况,如图1.2.9所示。当两个频率为ω-δω和ω+δω、波矢量为k-δk和k+δk的正弦波干涉时,它们相互作用的结果将产生一个光包络,即一个中心频率为ω的振荡场,其幅度被频率为δω的低频电场调制,最大幅度以波矢量δk运动,其速度称为群速度,用与式(1.2.7)类似的表达式表示为
图1.2.9 波长略不相同的一组光沿同一方向传输的情况[4]
群速度是幅度变化的包络移动的速度,因此它是能量或信息传播的速度。电场包络以群速度υg向前移动,而电场中的相位变化以相速度υ向前移动,如图1.2.8所示。
因为从式(1.2.7)可知ω=υk,相速度υ=c/n,所以介质中的群速度很容易从式(1.2.14)中得到。显然,在真空中,相速度就是光速c,与波长和传播常数k无关。在真空中,因为ω=ck,所以群速度为
在玻璃中,折射率是波长的函数,即n=n(λ),相速度υ也与波长或传播常数k有关,此时有
将式(1.2.16)代入式(1.2.14),就可以得到光在介质中的群速度,即
其中
式中,Ng为介质的群折射率,它表示介质对群速度的影响。
通常,许多介质的相对介电常数εr与光的频率有关,由式(1.2.13)和式(1.2.18)可知,折射率n和群折射率Ng与光的波长有关,所以相速度和群速度也与波长有关,这些介质就称为色散介质。纯SiO2玻璃的折射率n和纯SiO2折射率n群折射率Ng是光纤通信系统设计中的重要参数,它们都与波长有关。和群折射率Ng与波长的关系如图1.2.10所示。在1 550nm波长附近,波长越长,Ng越大,由式(1.2.17)可知,此时υg就越小,群延迟τg=1/υg就越大。注意,在λ=1 300nm附近,Ng最小且与λ几乎无关,因此1 300nm附近的光是以相同的群速度传播的,而不会产生色散。在光纤通信的光传输中,这种现象具有极其重要的意义,本书将在第2章讨论。
图1.2.10 纯SiO2折射率n和群折射率Ng与波长的关系
【例1.2.4】相速度、群折射率和群速度
考虑光在纯SiO2玻璃介质中传输,假如波长是1μm,该波长的折射率是1.450,请问相速度、群折射率和群速度是多少?
解:相速度
υ=c/n≈(3×108)/1.450m/s≈2.069×108m/s
从图1.2.10可知,λ=1μm时,Ng=1.46,因此
υg=c/Ng≈(3×108)/1.460m/s≈2.055×108m/s
由此可见,群速度比相速度约慢0.7%。