1 使用点对点信道的数据链路层

数据链路层使用的信道主要有以下两种类型:

  • 点对点信道。这种信道使用一对一的点对点通信方式。

  • 广播信道。这种信道使用一对多的广播通信方式,因此过程比较复杂。广播信道上连接的主机很多,因此必须使用专用的共享信道协议来协调这些主机的数据发送。

数据链路层的简单模型,主机 H1 向 H2 发送数据

1.1 数据链路和帧

链路(link)是一条无源的点到点的物理线路段,中间没有任何其他的交换结点。

  • 一条链路只是一条通路的一个组成部分

数据链路(data link)除了物理线路外,还必须有通信协议来控制这些数据的传输。若把实现这些协议的硬件和软件加到链路上,就构成了数据链路。

  • 现在最常用的方法是使用适配器(即网卡)来实现这些协议的硬件和软件。
  • 一般的适配器都包括了数据链路层和物理层这两层的功能。

2 数据链路层的 3H 问题

  1. How to 封装成帧
  2. How to 透明传输
  3. How to 差错控制

2.1 封装成帧

  • 封装成帧(framing)就是在一段数据的前后分别添加首部和尾部,然后就构成了一个帧。确定帧的界限。
  • 首部和尾部的一个重要作用就是进行帧定界。

2.2 透明传输(屏蔽边界符)

  1. 规则1:发送端的数据链路层在数据中如果出现了边界控制字符“SOH”或“EOT”,则在其前面插入一个转义字符“ESC”(其十六进制编码是 1B)。
  2. 规则2字节填充(byte stuffing)或字符填充(character stuffing)接收端的数据链路层在将数据送往网络层之前删除插入的转义字符。
  3. 规则3:如果转义字符也出现数据当中,那么应在转义字符前面再插入一个转义字符。当接收端收到连续的两个转义字符时,就删除其中前面的一个。
  • 用字节填充法解决透明传输问题

2.3 差错检测

在传输过程中可能会产生比特差错:1 可能会变成 0,而 0 也可能变成 1。在一段时间内,传输错误的比特占所传输比特总数的比率称为误码率 BER (Bit Error Rate)。

误码率与信噪比有很大的关系。为了保证数据传输的可靠性,在计算机网络传输数据时,必须采用各种差错检测措施。

2.3.1 循环冗余检验

在数据链路层传送的帧中,广泛使用了循环冗余检验 CRC 的检错技术。

  • 在发送端,先把数据划分为组,假定每组 k 个比特。
  • 假设待传送的一组数据为 M = 101001(则 k = 6),那么在 M 的后面再添加供差错检测用的 n 位冗余码一起发送。

接收端对收到的每一帧进行 CRC 检验:

  1. 若得出的余数 R = 0,则判定这个帧没有差错,就接收。
  2. 若余数 R ≠ 0,则判定这个帧有差错,就丢弃。

但这种检测方法并不能确定究竟是哪一个或哪几个比特出现了差错。只要经过严格的挑选,并使用位数足够多的除数 P,那么出现检测不到的差错的概率就很小很小。

2.3.2 冗余码的计算

用二进制的模 2 运算进行 $2^n $ 乘 M 的运算,这相当于在 M 后面添加 n 个 0。

得到的 (k + n) 位的数除以事先选定好的长度为 (n + 1) 位的除数 P,得出商是 Q 而余数是 R,余数 R 比除数 P 少1 位,即 R 是 n 位。

2.3.3 冗余码的计算举例

现在 k = 6, 即 M = 101001。设 n = 3, 除数 P = 1101,被除数是 2nM = 101001000。

模 2 运算的结果是:商 Q = 110101,余数 R = 001。

把余数 R 作为冗余码添加在数据 M 的后面发送出去。发送的数据是:2nM + R , 即:101001001,共 (k + n) 位。

  • 循环冗余检验的原理说明

2.3.4 帧检验序列 FCS

在数据后面添加上的冗余码称为帧检验序列 FCS (Frame Check Sequence)。

循环冗余检验 CRC 和帧检验序列 FCS并不等同。

  • CRC 是一种常用的检错方法,而 FCS 是添加在数据后面的冗余码。
  • FCS 可以用 CRC 这种方法得出,但 CRC 并非用来获得 FCS 的唯一方法。

仅用循环冗余检验 CRC 差错检测技术只能做到无差错接受。“无差错接受”是指:“凡是接受的帧(即不包括丢弃的帧),我们都能以非常接近于 1 的概率认为这些帧在传输过程中没有产生差错”。

也就是说:“凡是接收端数据链路层接受的帧都没有传输差错”(有差错的帧就丢弃不接受)。要做到“可靠传输”(即发送什么就收到什么)就必须再加上确认和重传机制。


3 点对点协议 PPP

3.1 PPP 协议的特点

  • 现在全世界使用得最多的数据链路层协议是点对点协议 PPP (Point-to-Point Protocol)。
  • 固定用户使用电话线接入因特网时,一般都是使用 PPP 协议。

用户到 ISP 的链路使用 PPP 协议:

3.2 PPP 协议的组成

1992 年制订了 PPP 协议。经过 1993 年和 1994 年的修订,现在的 PPP 协议已成为因特网的正式标准[RFC 1661]。

PPP 协议有三个组成部分:

  1. 一个将 IP 数据报封装到串行链路的方法。
  2. 链路控制协议 LCP (Link Control Protocol)。
  3. 网络控制协议 NCP (Network Control Protocol)。

3.3 PPP 协议的帧格式

  • 标志字段 F = 0x7E (符号“0x”表示后面的字符是用十六进制表示。十六进制的 7E 的二进制表示是 01111110)。
  • 地址字段 A 只置为 0xFF。地址字段实际上并不起作用。
  • 控制字段 C 通常置为 0x03。

PPP 是面向字节的,所有的 PPP 帧的长度都是整数字节。

PPP 有一个 2 个字节的协议字段。

  • 当协议字段为 0x0021 时,PPP 帧的信息字段就是IP 数据报。
  • 若为 0xC021, 则信息字段是 PPP 链路控制数据。
  • 若为 0x8021,则表示这是网络控制数据。

3.4 透明传输问题

  • 当 PPP 用在同步传输链路时,协议规定采用硬件来完成比特填充(和 HDLC 的做法一样)。
  • 当 PPP 用在异步传输时,就使用一种特殊的字符填充法。

3.4.1 字符填充

将信息字段中出现的每一个 0x7E 字节转变成为 2 字节序列(0x7D, 0x5E)。 若信息字段中出现一个 0x7D 的字节, 则将其转变成为 2 字节序列(0x7D, 0x5D)。

若信息字段中出现 ASCII 码的控制字符(即数值小于 0x20 的字符),则在该字符前面要加入一个 0x7D 字节,同时将该字符的编码加以改变。

3.4.2 零比特填充

PPP 协议用在 SONET/SDH 链路时,是使用同步传输(一连串的比特连续传送)。这时 PPP 协议采用零比特填充方法来实现透明传输。

在发送端,只要发现有 5 个连续 1,则立即填入一个 0。接收端对帧中的比特流进行扫描。每当发现 5 个连续1时,就把这 5 个连续 1 后的一个 0 删除,

  • 信息字段中出现了和标志字段 F 完全一样的 8 比特组合

  • 发送端在 5 个连 1 之后填入 0 比特再发送出去

  • 在接收端把 5 个连 1之后的 0 比特删除

3.5 不提供使用序号和确认的可靠传输

PPP 协议之所以不使用序号和确认机制是出于以下的考虑:

  1. 在数据链路层出现差错的概率不大时,使用比较简单的 PPP 协议较为合理。
  2. 在因特网环境下,PPP 的信息字段放入的数据是 IP 数据报。数据链路层的可靠传输并不能够保证网络层的传输也是可靠的。
  3. 帧检验序列 FCS 字段可保证无差错接受。

3.6 PPP 协议的工作状态

当用户拨号接入 ISP 时,路由器的调制解调器对拨号做出确认,并建立一条物理连接。

  • PC 机向路由器发送一系列的 LCP 分组(封装成多个 PPP 帧)。
  • 这些分组及其响应选择一些 PPP 参数,和进行网络层配置,NCP 给新接入的 PC机分配一个临时的 IP 地址,使 PC 机成为因特网上的一个主机。
  • 通信完毕时,NCP 释放网络层连接,收回原来分配出去的 IP 地址。接着,LCP 释放数据链路层连接。最后释放的是物理层的连接。

4 使用广播信道的数据链路层

4.1 局域网的数据链路层

局域网最主要的特点是:网络为一个单位所拥有,且地理范围和站点数目均有限。

局域网具有如下的一些主要优点:

  1. 具有广播功能,从一个站点可很方便地访问全网。局域网上的主机可共享连接在局域网上的各种硬件和软件资源。
  2. 便于系统的扩展和逐渐地演变,各设备的位置可灵活调整和改变。
  3. 提高了系统的可靠性、可用性和残存性。

4.1.1 局域网的拓扑

局域网工作的层次跨越了数据链路层和物理层。由于局域网技术中有关数据链路层的内容比较丰富,因此放在数据链路层进行讨论,但并不代表局域网仅与数据链路层有关。

4.1.2 信道共享技术

共享信道要考虑如何让众多用户能够合理而方便地共享通信媒体资源,通常有两种方法:

  1. 静态划分信道:频分复用、时分复用、波分复用、码分复用
  2. 动态媒体接入控制(多点接入)
    • 随机接入,所有用户可随机发送信息。但如果恰巧有两个或更多的用户在同一时刻发送信息,就会在共享媒体上产生碰撞,使得这些用户的发送都失败,因此必须有解决碰撞的协议。
    • 受控接入 ,如多点线路探询(polling),或轮询。

4.1.3 以太网的两个标准

  1. DIX Ethernet V2 是世界上第一个局域网产品(以太网)的规约。
  2. IEEE 的 802.3 标准。

DIX Ethernet V2 标准与 IEEE 的 802.3 标准只有很小的差别,因此可以将 802.3 局域网简称为“以太网”。严格说来,“以太网”应当是指符合 DIX Ethernet V2 标准的局域网。

由于有很多不同的局域网标准,为了使数据链路层能更好地适应多种局域网标准,IEEE 802委员会就把局域网的数据链路层拆分魏两个子层:

  • 逻辑链路控制 LLC (Logical Link Control)子层
  • 媒体接入控制 MAC (Medium Access Control)子层

与接入到传输媒体有关的内容都放在 MAC子层,而 LLC 子层则与传输媒体无关,不管采用何种协议的局域网对 LLC 子层来说都是透明的。

由于 TCP/IP 体系经常使用的局域网是 DIX Ethernet V2 而不是 802.3 标准中的几种局域网,因此现在 802 委员会制定的逻辑链路控制子层 LLC(即 802.2 标准)的作用已经不大了。

很多厂商生产的适配器上就仅装有 MAC 协议而没有 LLC 协议,所以以后一般不考虑LLC层。

4.2 适配器的作用

网络接口板又称为通信适配器(adapter)或网络接口卡 NIC(Network Interface Card),或“网卡”。

适配器的重要功能:

  1. 进行串行/并行转换:适配器和局域网之间的通信是通过电缆或双绞线以串行传输方式进行的,但是适配器和计算机之间的通信是通过计算机主板上的I/O总线以并行方式进行的。
  2. 对数据进行缓存:网络上的数据率和计算机总线上的数据率并不相同。
  3. 在计算机的操作系统安装设备驱动程序:驱动程序会告诉适配器,应当从存储器的什么位置把多长的数据块发送到局域网上,或者应该在存储器的什么位置把局域网上的数据块存储下来。
  4. 实现以太网协议

当适配器收到有差错的帧时,直接丢弃而不用通知计算机。收到正确的帧时,通过中断通知该计算机,并交付协议栈中的网络层。

计算机的硬件地址就在适配器的ROM中,而软件地址—IP地址在计算机的存储器中。

4.3 CSMA/CD协议

最初的以太网是将许多计算机都连接到一根总线上。当初认为这样的连接方法既简单又可靠,因为总线上没有有源器件。

以太网的广播方式发送,总线上的每一个工作的计算机都能检测到 B 发送的数据信号。由于只有计算机 D 的地址与数据帧首部写入的地址一致,因此只有 D 才接收这个数据帧。

其他所有的计算机(A, C 和 E)都检测到不是发送给它们的数据帧,因此就丢弃这个数据帧而不能够收下来,从而在具有广播特性的总线上实现了一对一的通信。

为了通信的简便,以太网采取了两种重要的措施:

  1. 采用较为灵活的无连接的工作方式,即不必先建立连接就可以直接发送数据。

  2. 以太网对发送的数据帧不进行编号,也不要求对方发回确认。

    以太网提供的服务是不可靠的交付,即尽最大努力的交付。当目的站收到有差错的数据帧时就丢弃此帧,其他什么也不做。差错的纠正由高层来决定。如果高层发现丢失了一些数据而进行重传,但以太网并不知道这是一个重传的帧,而是当作一个新的数据帧来发送。

这样做的理由是局域网信道的质量很好,因信道质量产生差错的概率是很小的。

以太网发送的数据都使用曼彻斯特(Manchester)编码,码元1是前高后低,码元0是前低后高,这就保证了在每一个比特的正中间出现一次电压的转换,而接收端就利用这种电压的转换很方便地把位同步信号提取出来。

但是从曼彻斯特编码的波形图可以看出,其所占频带宽度比原始的基带信号增加了一倍(因为每秒传送的码元数加倍了)。

CSMA/CD 表示 Carrier Sense Multiple Access with Collision etection,即载波监听、多点接入、碰撞检测

  • 多点接入”表示许多计算机以多点接入的方式连接在一根总线上。

  • 载波监听”是指每一个站在发送数据之前先要检测一下总线上是否有其他计算机在发送数据,如果有,则暂时不要发送数据,以免发生碰撞。

    总线上并没有什么“载波”。因此, “载波监听”就是用电子技术检测总线上有没有其他计算机发送的数据信号。

  • 碰撞检测”就是计算机边发送数据边检测信道上的信号电压大小。

当几个站同时在总线上发送数据时,总线上的信号电压摆动值将会增大(互相叠加)。当一个站检测到的信号电压摆动值超过一定的门限值时,就认为总线上至少有两个站同时在发送数据,表明产生了碰撞。所谓“碰撞”就是发生了冲突。因此“碰撞检测”也称为“冲突检测”。

在发生碰撞时,总线上传输的信号产生了严重的失真,无法从中恢复出有用的信息来。

每一个正在发送数据的站,一旦发现总线上出现了碰撞,就要立即停止发送,免得继续浪费网络资源,然后等待一段随机时间后再次发送。

4.3.1 电磁波在总线上的有限传播速率的影响

当某个站监听到总线是空闲时,也可能总线并非真正是空闲的。A 向 B 发出的信息,要经过一定的时间后才能传送到 B。

B 若在 A 发送的信息到达 B 之前发送自己的帧(因为这时 B 的载波监听检测不到 A 所发送的信息),则必然要在某个时间和 A 发送的帧发生碰撞。碰撞的结果是两个帧都变得无用。

因此,使用 CSMA/CD 协议的以太网不能进行全双工通信而只能进行双向交替通信(半双工通信)。每个站在发送数据之后的一小段时间内,存在着遭遇碰撞的可能性。 这种发送的不确定性使整个以太网的平均通信量远小于以太网的最高数据率。

最先发送数据的A站在至多经过时间$2t$就可知道有没有发生碰撞,因此以太网的端到端往返时间$2t$又被称为争用期,也叫碰撞窗口。只有经过争用期时间还没有检测到碰撞,才能肯定这次发送不会发生碰撞。

4.3.2 二进制指数类型退避算法

发生碰撞的站在停止发送数据后,要推迟(退避)一个随机时间才能再发送数据。

为了尽可能减小重传时再次发生冲突的概率,退避算法有以下具体的规定:

  1. 基本退避时间取为争用期 2t,具体的争用期时间是51.2us。对于10M/bits以太网在争用期可发送512比特,即64字节,也可以说争用期是512比特时间。

  2. 从整数集合$\left[0,1, \ldots,\left(2^{k}-1\right)\right]$中随机地取出一个数,记为 r。重传所需的时延就是 r 倍的基本退避时间。

  3. 参数 k 按下面的公式计算:

    当 k ≤ 10 时,参数 k 等于重传次数。

$$
k= \min [重传次数, 10]
$$

  1. 当重传达 16 次仍不能成功时即丢弃该帧,并向高层报告。

如果发生冲突,就一定是在发送的前 64 字节之内。由于一检测到冲突就立即中止发送,这时已经发送出去的数据一定小于 64 字节。

以太网规定了最短有效帧长为 64 字节,凡长度小于 64 字节的帧都是由于冲突而异常中止的无效帧。

当发送数据的站一旦发现发生了碰撞时:

  1. 立即停止发送数据;
  2. 再继续发送若干比特的**人为干扰信号(jamming signal)**,以便让所有用户都知道现在已经发生了碰撞。

B 也能够检测到冲突,并立即停止发送数据帧,接着就发送干扰信号。这里为了简单起见,只画出 A 发送干扰信号的情况。

以太网还规定了帧间最小间隔为9.6us,相当于96比特时间,这样做是为了使刚刚收到数据帧的站的接收缓存来得及清理,做好接受下一帧的准备。

4.4 使用广播信道的以太网

4.4.1 使用集线器的星形拓扑

传统以太网最初是使用粗同轴电缆,后来演进到使用比较便宜的细同轴电缆,最后发展为使用更便宜和更灵活的双绞线。

这种以太网采用星形拓扑,在星形的中心则增加了一种可靠性非常高的设备,叫做集线器(hub) 。集线器使用了大规模集成电路芯片,因此这样的硬件设备的可靠性已大大提高了。

每个站需要使用两对无屏蔽双绞线(放在同一根电缆中),分别用于发送和接受。

1990年IEEE制作出星形网 10BASE-T的标准802.3i。

  • 10代表10Mbit/s的数据率
  • BASE代表连接线上的信号是基带信号
  • T代表双绞线

这种 10 Mb/s 速率的无屏蔽双绞线星形网的出现,既降低了成本,又提高了可靠性。但10BASE-T 的通信距离稍短,每个站到集线器的距离不超过 100 m。10BASE-T 双绞线以太网的出现,是局域网发展史上的一个非常重要的里程碑,它为以太网在局域网中的统治地位奠定了牢固的基础。

集线器的一些特点:

  1. 集线器是使用电子器件来模拟实际电缆线的工作,因此整个系统仍然像一个传统的以太网那样运行。
  2. 使用集线器的以太网在逻辑上仍是一个总线网,各工作站使用的还是 CSMA/CD 协议,并共享逻辑上的总线。
  3. 集线器很像一个多接口的转发器,工作在物理层,不进行碰撞检测。

  1. 集线器一般都有少量的容错能力和网络管理能力。

4.4.2 以太网的 MAC 层

4.4.2.1 MAC 层的硬件地址

在局域网中,硬件地址又称为物理地址,或 MAC 地址。802 标准所说的“地址”严格地讲应当是每一个站的“名字”或标识符。

IEEE 802规定MAC地址字段使用6字节(48位)。

  • IEEE 的注册管理机构 RA 负责向厂家分配地址字段的前三个字节(即高位 24 位)。
  • 地址字段中的后三个字节(即低位 24 位)由厂家自行指派,称为扩展标识符,必须保证生产出的适配器没有重复地址。

一个地址块可以生成$2^{24}$个不同的地址。这种 48 位地址称为 MAC-48,它的通用名称是EUI-48。

“MAC地址”实际上就是适配器地址或适配器标识符EUI-48。

4.4.2.2 适配器检查 MAC 地址

适配器从网络上每收到一个 MAC 帧就首先用硬件检查 MAC 帧中的 MAC 地址:

  • 如果是发往本站的帧则收下,然后再进行其他的处理。
  • 否则就将此帧丢弃,不再进行其他的处理。

“发往本站的帧”包括以下三种帧:

  • 单播(unicast)帧(一对一)
  • 广播(broadcast)帧(一对全体)
  • 多播(multicast)帧(一对多)

所有的适配器都至少应当能够识别前两种帧,有的适配器可用编程的方法识别多播地址。

4.4.2.3 MAC 帧的格式

常用的以太网MAC帧格式有两种标准:

  1. DIX Ethernet V2 标准
  2. IEEE 的 802.3 标准

最常用的 MAC 帧是以太网 V2 的格式。

  • 类型字段:用来标志上一层使用的是什么协议,
    以便把收到的 MAC 帧的数据上交给上一层的这个协议。
  • 数据字段:正式名称是 MAC 客户数据字段,最小长度 64 字节 - 18 字节的首部和尾部 = 数据字段的最小长度。
  • FCS:帧检验序列,当传输媒体的误码率为$1 \times 10^{-8}$时, MAC 子层可使未检测到的差错小于$1 \times 10^{-14}$。

当数据字段的长度小于 46 字节时,应在数据字段的后面加入整数字节的填充字段,以保证以太网的 MAC 帧长不小于 64 字节。

在帧的前面插入的 8 字节中的第一个字段共 7 个字节,是前同步码,用来迅速实现 MAC 帧的比特同步。第二个字段是帧开始定界符,表示后面的信息就是MAC 帧。 为了达到比特同步,在传输媒体上实际传送的要比 MAC 帧还多 8 个字节。

以太网不需要封装成帧和透明传输,因为可以使用曼彻斯特编码来识别是否是同一个帧。

以下情况为无效的 MAC 帧:

  1. 帧的长度不是整数个字节;
  2. 用收到的帧检验序列 FCS 查出有差错;
  3. 数据字段的长度不在 46 ~ 1500 字节之间。

对于检查出的无效 MAC 帧就简单地丢弃。以太网不负责重传丢弃的帧。


5 扩展的以太网

讨论如何把以太网的覆盖范围扩展。

在物理层扩展局域网:主机使用光纤和一对光纤调制解调器连接到集线器。

光纤调制解调器的作用就是进行电信号和光信号的转换,光纤的时延很小,并且带宽很宽,因此可以很容易使主机和几公里之外的集线器相连接。

用多个集线器可连成更大的局域,某大学有三个系,各自有一个局域网。

用集线器组成更大的局域网都在一个碰撞域中。

5.1 在数据链路层扩展以太网