网络设备巡检指导
目 录
第一章 网络总体运行状况分析 . .................................................................................................... 3 第二章 设备运行情况分析 . ............................................................................................................ 4
2.1 系统运行基本情况检查 ................................................................................................... 4 2.2 Cisco 网络设备各项内容检查 . ..................................................................................... 11 第三章 网络连通情况检查 . .......................................................................................................... 27 第四章 网络性能情况检查 . .......................................................................................................... 28 第五章 检查工具使用 . .................................................................................................................. 29
5.1 Ping命令 ........................................................................................................................ 29 5.2 trace命令 ....................................................................................................................... 32
第一章 网络总体运行状况分析
IP 网络系统的巡检包括设备运行情况, 节点连通情况, 网络性能三个方面 , 其结果如下:
检查项目
Cisco 设备IOS/COS 版本 Cisco 设备CPU 利用状况检查 Cisco 设备memory 利用状况检查 Cisco 设备模块运行状况检查 Cisco 设备系统电源及风扇检查 Cisco 设备运行温度检查 Cisco 设备系统Log 检查
VLAN 状态检查 Etherchannel 检查
trunk 检查 路由状况检查 组播路由情况检查 PIM 状态检查 Spanning-tree 检查 OSPF 状态检查
检查结果
接口状态检查 防火墙功能检查 所有节点连通情况
大致性能
第二章 设备运行情况分析
针对网络中设备, 确认系统设备的运行状况(由于各版本的IOS 命令差异, 文中提到的命令只做参考)
telnet 所要检查的交换机或路由器, 输入登陆密码后打入enable 命令,键入超级登录密码,出现路由器名称(这里假设路由器名称为Cisco) ,待出现Cisco#提示符后,表示已经进入特权模式, 以下所有检查命令均在特权模式下输入. 检查范例中红体字部分为检查要点。 2.1 系统运行基本情况检查
2.2 Cisco 网络设备各项内容检查
11 / 35
12 / 35
13 / 35
14 / 35
15 / 35
16 / 35
17 / 35
18 / 35
19 / 35
20 / 35
21 / 35
22 / 35
23 / 35
24 / 35
25 / 35
26 / 35
第三章 网络连通情况检查
27 / 35
第四章 网络性能情况检查
28 / 35
第五章 检查工具使用
5.1 Ping 命令 Ping 是最常使用的故障诊断与排除命令。它由一组ICMP 回应请求报文组成,如果网络正常运行将返回一组回应应答报文。ICMP 消息以IP 数据包传输,因此接收到ICMP 回应应答消息能够表明第三层以下的连接都工作正常。
Cisco 的ping 命令不但支持IP 协议,而且支持大多数其他的桌面协议,如IPX 和AppleTalk 协议的ping 命令。我们首先看一下支持IP 协议的ping 命令以用户EXEC 方式执行的情况,然后再讨论在特权模式下,扩展的ping 命令包含的许多强大功能。 用户执行模式
IP PING 简单的IP ping既可以在用户模式下执行,也可以在特权模式下执行。正常情况下,命令会发送回5个回应请求,5个惊叹号表明所有的请求都成功地接收到了响应。输出中还包括最大、最小和平均往返时间等信息。
每一个“!”表明一个echo 响应被成功的接受,如果不是“!”号,则表明echo 响应未被接收到的原因:
! 响应成功接收
· 请求超时
U 目的不可达
P 协议不可达
29 / 35
N 网络不可达
Q 源抑制
M 不能分段
? 不可知报文类型
特权执行模式
在特权执行模式下,扩展的ping 命令适用于任何一种桌面协议。它包含更多的功能属性,因此可以获得更为详细的信息。通过这些信息我们可以分析网络性能下降的原因而不单单是服务丢失的原因。扩展的ping 命令的执行方式也是敲入ping 。然后路由器提示各种不同的属性。
EXTENDED IP PING 其使用方法如下所示:
YH-Router#ping
Protocol [ip]:
Target IP address: 165.48.183.12
Repeat count [5]: 10
Datagram size [100]: 1600
Timeout in seconds [2]:
Extended commands [n]: y
Source address or interface: 165.48.48.3
Type of service [0]:
Set DF bit in IP header? [no]:
Data pattern [0xABCD]:
Loose, Srict, Record, Timestamp, Verbose[none]:
30 / 35
Sweep range of sizes [n]:
Type escape sequence to abort.
Sending 10, 1600-byte ICMP Echoes to 165.58.183.12, timeout is 2 seconds: !!!!!!!!!!
Success rate is 100 percent (10/10), round-trip min/avg/max = 36/39/48 ms 首先我们讨论特权模式下的ping 的各种可用属性。每种属性的缺省值在括号中显示。 Protocol 需要测试的协议。
Target address 测试的目标地址。
Repeat count 如果出现间歇性的失败或者响应时间过慢,ping 重复的次数。
Datagram size 如果怀疑报文由于延迟过长或者分段失败而丢失,则可以提高报文的大小。例如,我们可以使用1600字节的报文来强制分段。
Timeout 如果怀疑超时是由于响应过慢而不是报文丢失,则可以提高该值。
Extended commands 回答确定以获得扩展属性。
Source address 必须是路由器接口的地址。
Type of service 根据RFC 791 TOS规定的属性,通常缺省值为0。
Set DF bit in IP header? 通过设置DF 位禁止分段,即使是报文超过了路由器定义的MTU 也禁止分段。
Data pattern [0xABCD] 通过改变数据模式可以测试线路的噪声。
Loose ,Strict ,Record ,Timestamp ,Verbose[none] 这些都是IP 报文头的属性。一般只使用Record 属性和Verbose ,其他属性很少被使用。Record 可以用来记录报文每一跳的地址,Verbose 属性给出每一个回应应答的响应时间。。
Sweep range of sizes [n] 该属性主要用于测试大报文被丢失、处理速度过慢或者分
段失败等故障。
5.2 trace 命令
trace 命令提供路由器到目的地址的每一跳的信息。它通过控制IP 报文的生存期(TTL )字段来实现。TTL 等于1的ICMP 回应请求报文将被首先发送。路径上的第一个路由器将会丢弃该报文并且发送回标识错误消息的报文。错误消息通常是ICMP 超时消息,表明报文顺利到达路径的下一跳,或者端口不可达消息,表明报文已经被目的地址接收但是不能向上传送到IP 协议栈。
为了获得往返延迟时间的信息,trace 发送三个报文并显示平均延迟时间。然后将报文的TTL 字段加1并发送3个报文。这些报文将到达路径的第二个路由器上,并返回超时错误或者端口不可达消息。反复使用这一方法,不断增加报文的TTL 字段的值,直到接收到目的地址的响应消息。
在有些情况下,使用trace 命令可能会导致故障。因为IOS 中存在与trace 命令相关的bug 。这些bug 的相关信息可以从CCO 得到。另外一个问题是,某些目标站点不响应ICMP 端口不可达消息。当命令的输出显示一系列星号(*)时,就可能碰到了此类站点。用户可以使用Ctrl-Shift-6中断命令的执行。
用户执行模式 下面展示了一个简单的在用户执行模式下执行的trace 命令的输出。到达目的地的距离是3跳。TTL 值为1的3个报文的响应消息是ICMP 超时错误,并且返回报文的IP 地址有两个。因为路由器1和路由器2在同一个网段中,并且它们到路由器3的距离都是一跳,因此这些路由器都响应该报文。
Router3#trace 171.144.1.39
Type escape sequence to abort.
Tracing the route to Router9 (171.144.1.39)
1 Router2 (165.48.48.2) 0 msec
Router2 (165.48.48.2) 0 msec
Router1 (165.48.48.1) 0 msec
2 165.48.48.129 12 msec
Router6 (165.48.49.129) 12 msec
12 msec 3 Router4 (171.133.1.2) 12 msec
12 msec Router9 (171.144.1.39) 12 msec
12 msec Router3
下面列出了IP trace命令的输出中出现的不同字符及其含义: XY msec 在接收到响应消息之前的往返延迟(以毫秒为单位)
* 报文超时
? 报文类型不能识别
U 端口不可达
P 协议不可达
N 网络不可达
H 主机不可达
Q ICMP 源抑制
特权模式扩展Trace 用于扩展ping 命令的许多属性都可以用来扩展trace 命令的功能。扩展trace 命令的特殊属性有:
Numeric display 在缺省情况下,trace 命令的输出中既包括IP 地址也包括其对应的DNS
域名。如果用户不需要显示DNS 域名,则可以使用该属性。
Probe count 其缺省值为3,用户可以根据需要进行调整。
TTL 该值可以在最大和最小TTL 值之间变化。
Port number 这是一个非常有用的属性,它可以使工程技术人员跟踪特定的传输层端口。因此,不但可以确认源端与目的端之间的IP 连通性,而且可以确认高层服务是否可被访问。 与trace 命令相关的另外一个问题是,如果存在到达目的地的多条路径,返回报文的源地址可能不相同。在这种情况下,用户需要仔细比较不同返回报文的延迟时间。如果仍不能得到明确的结果,可以远程访问路径上的一个或多个路由器,使用trace 命令访问源地址和目的地址。
理解Cisco 错误消息
错误消息格式
系统错误消息格式如下:
%Facility - subfacility - Severity - Mnemonic : Message Text
Facility 它指出错误消息涉及的设备名。该值可以是协议、硬件设备或者系统软件模块。
Subfacility 它仅与通道接口处理器(CIP )卡有关。详细的信息可以参见Cisco 文档的相关章节。
Severity 它是一个范围在0到7之间的数字。数字的值越小,严重程度越高。
Mnemonic 唯一标识错误消息的单值代码。该代码通常可以暗示错误的类型。
Message Text 它是错误消息的简短描述,其中包括涉及的路由器硬件和软件信息。 下面是一些错误消息的示例。用户可以查阅CCO ISO文档的系统错误消息一节,以查找这
些错误消息的说明。
%DUAL-3-SIA:Route 171.155.148.192/26 stuck-in-active state in IP-EIGP 211. Cleaning up
%LANCE-3-OWNERR: Unit 0, buffer ownership error
需要注意的是,并不是所有的消息都涉及到故障或者问题的状况。某些消息显示的是状态方面的信息。例如,以下消息仅表明ISDN BRI 0接口与特定的远端数据连接。 %ISDN-6-CONNECT: Interface BRI0 is now connected to 95551212
网络设备巡检指导
目 录
第一章 网络总体运行状况分析 . .................................................................................................... 3 第二章 设备运行情况分析 . ............................................................................................................ 4
2.1 系统运行基本情况检查 ................................................................................................... 4 2.2 Cisco 网络设备各项内容检查 . ..................................................................................... 11 第三章 网络连通情况检查 . .......................................................................................................... 27 第四章 网络性能情况检查 . .......................................................................................................... 28 第五章 检查工具使用 . .................................................................................................................. 29
5.1 Ping命令 ........................................................................................................................ 29 5.2 trace命令 ....................................................................................................................... 32
第一章 网络总体运行状况分析
IP 网络系统的巡检包括设备运行情况, 节点连通情况, 网络性能三个方面 , 其结果如下:
检查项目
Cisco 设备IOS/COS 版本 Cisco 设备CPU 利用状况检查 Cisco 设备memory 利用状况检查 Cisco 设备模块运行状况检查 Cisco 设备系统电源及风扇检查 Cisco 设备运行温度检查 Cisco 设备系统Log 检查
VLAN 状态检查 Etherchannel 检查
trunk 检查 路由状况检查 组播路由情况检查 PIM 状态检查 Spanning-tree 检查 OSPF 状态检查
检查结果
接口状态检查 防火墙功能检查 所有节点连通情况
大致性能
第二章 设备运行情况分析
针对网络中设备, 确认系统设备的运行状况(由于各版本的IOS 命令差异, 文中提到的命令只做参考)
telnet 所要检查的交换机或路由器, 输入登陆密码后打入enable 命令,键入超级登录密码,出现路由器名称(这里假设路由器名称为Cisco) ,待出现Cisco#提示符后,表示已经进入特权模式, 以下所有检查命令均在特权模式下输入. 检查范例中红体字部分为检查要点。 2.1 系统运行基本情况检查
2.2 Cisco 网络设备各项内容检查
11 / 35
12 / 35
13 / 35
14 / 35
15 / 35
16 / 35
17 / 35
18 / 35
19 / 35
20 / 35
21 / 35
22 / 35
23 / 35
24 / 35
25 / 35
26 / 35
第三章 网络连通情况检查
27 / 35
第四章 网络性能情况检查
28 / 35
第五章 检查工具使用
5.1 Ping 命令 Ping 是最常使用的故障诊断与排除命令。它由一组ICMP 回应请求报文组成,如果网络正常运行将返回一组回应应答报文。ICMP 消息以IP 数据包传输,因此接收到ICMP 回应应答消息能够表明第三层以下的连接都工作正常。
Cisco 的ping 命令不但支持IP 协议,而且支持大多数其他的桌面协议,如IPX 和AppleTalk 协议的ping 命令。我们首先看一下支持IP 协议的ping 命令以用户EXEC 方式执行的情况,然后再讨论在特权模式下,扩展的ping 命令包含的许多强大功能。 用户执行模式
IP PING 简单的IP ping既可以在用户模式下执行,也可以在特权模式下执行。正常情况下,命令会发送回5个回应请求,5个惊叹号表明所有的请求都成功地接收到了响应。输出中还包括最大、最小和平均往返时间等信息。
每一个“!”表明一个echo 响应被成功的接受,如果不是“!”号,则表明echo 响应未被接收到的原因:
! 响应成功接收
· 请求超时
U 目的不可达
P 协议不可达
29 / 35
N 网络不可达
Q 源抑制
M 不能分段
? 不可知报文类型
特权执行模式
在特权执行模式下,扩展的ping 命令适用于任何一种桌面协议。它包含更多的功能属性,因此可以获得更为详细的信息。通过这些信息我们可以分析网络性能下降的原因而不单单是服务丢失的原因。扩展的ping 命令的执行方式也是敲入ping 。然后路由器提示各种不同的属性。
EXTENDED IP PING 其使用方法如下所示:
YH-Router#ping
Protocol [ip]:
Target IP address: 165.48.183.12
Repeat count [5]: 10
Datagram size [100]: 1600
Timeout in seconds [2]:
Extended commands [n]: y
Source address or interface: 165.48.48.3
Type of service [0]:
Set DF bit in IP header? [no]:
Data pattern [0xABCD]:
Loose, Srict, Record, Timestamp, Verbose[none]:
30 / 35
Sweep range of sizes [n]:
Type escape sequence to abort.
Sending 10, 1600-byte ICMP Echoes to 165.58.183.12, timeout is 2 seconds: !!!!!!!!!!
Success rate is 100 percent (10/10), round-trip min/avg/max = 36/39/48 ms 首先我们讨论特权模式下的ping 的各种可用属性。每种属性的缺省值在括号中显示。 Protocol 需要测试的协议。
Target address 测试的目标地址。
Repeat count 如果出现间歇性的失败或者响应时间过慢,ping 重复的次数。
Datagram size 如果怀疑报文由于延迟过长或者分段失败而丢失,则可以提高报文的大小。例如,我们可以使用1600字节的报文来强制分段。
Timeout 如果怀疑超时是由于响应过慢而不是报文丢失,则可以提高该值。
Extended commands 回答确定以获得扩展属性。
Source address 必须是路由器接口的地址。
Type of service 根据RFC 791 TOS规定的属性,通常缺省值为0。
Set DF bit in IP header? 通过设置DF 位禁止分段,即使是报文超过了路由器定义的MTU 也禁止分段。
Data pattern [0xABCD] 通过改变数据模式可以测试线路的噪声。
Loose ,Strict ,Record ,Timestamp ,Verbose[none] 这些都是IP 报文头的属性。一般只使用Record 属性和Verbose ,其他属性很少被使用。Record 可以用来记录报文每一跳的地址,Verbose 属性给出每一个回应应答的响应时间。。
Sweep range of sizes [n] 该属性主要用于测试大报文被丢失、处理速度过慢或者分
段失败等故障。
5.2 trace 命令
trace 命令提供路由器到目的地址的每一跳的信息。它通过控制IP 报文的生存期(TTL )字段来实现。TTL 等于1的ICMP 回应请求报文将被首先发送。路径上的第一个路由器将会丢弃该报文并且发送回标识错误消息的报文。错误消息通常是ICMP 超时消息,表明报文顺利到达路径的下一跳,或者端口不可达消息,表明报文已经被目的地址接收但是不能向上传送到IP 协议栈。
为了获得往返延迟时间的信息,trace 发送三个报文并显示平均延迟时间。然后将报文的TTL 字段加1并发送3个报文。这些报文将到达路径的第二个路由器上,并返回超时错误或者端口不可达消息。反复使用这一方法,不断增加报文的TTL 字段的值,直到接收到目的地址的响应消息。
在有些情况下,使用trace 命令可能会导致故障。因为IOS 中存在与trace 命令相关的bug 。这些bug 的相关信息可以从CCO 得到。另外一个问题是,某些目标站点不响应ICMP 端口不可达消息。当命令的输出显示一系列星号(*)时,就可能碰到了此类站点。用户可以使用Ctrl-Shift-6中断命令的执行。
用户执行模式 下面展示了一个简单的在用户执行模式下执行的trace 命令的输出。到达目的地的距离是3跳。TTL 值为1的3个报文的响应消息是ICMP 超时错误,并且返回报文的IP 地址有两个。因为路由器1和路由器2在同一个网段中,并且它们到路由器3的距离都是一跳,因此这些路由器都响应该报文。
Router3#trace 171.144.1.39
Type escape sequence to abort.
Tracing the route to Router9 (171.144.1.39)
1 Router2 (165.48.48.2) 0 msec
Router2 (165.48.48.2) 0 msec
Router1 (165.48.48.1) 0 msec
2 165.48.48.129 12 msec
Router6 (165.48.49.129) 12 msec
12 msec 3 Router4 (171.133.1.2) 12 msec
12 msec Router9 (171.144.1.39) 12 msec
12 msec Router3
下面列出了IP trace命令的输出中出现的不同字符及其含义: XY msec 在接收到响应消息之前的往返延迟(以毫秒为单位)
* 报文超时
? 报文类型不能识别
U 端口不可达
P 协议不可达
N 网络不可达
H 主机不可达
Q ICMP 源抑制
特权模式扩展Trace 用于扩展ping 命令的许多属性都可以用来扩展trace 命令的功能。扩展trace 命令的特殊属性有:
Numeric display 在缺省情况下,trace 命令的输出中既包括IP 地址也包括其对应的DNS
域名。如果用户不需要显示DNS 域名,则可以使用该属性。
Probe count 其缺省值为3,用户可以根据需要进行调整。
TTL 该值可以在最大和最小TTL 值之间变化。
Port number 这是一个非常有用的属性,它可以使工程技术人员跟踪特定的传输层端口。因此,不但可以确认源端与目的端之间的IP 连通性,而且可以确认高层服务是否可被访问。 与trace 命令相关的另外一个问题是,如果存在到达目的地的多条路径,返回报文的源地址可能不相同。在这种情况下,用户需要仔细比较不同返回报文的延迟时间。如果仍不能得到明确的结果,可以远程访问路径上的一个或多个路由器,使用trace 命令访问源地址和目的地址。
理解Cisco 错误消息
错误消息格式
系统错误消息格式如下:
%Facility - subfacility - Severity - Mnemonic : Message Text
Facility 它指出错误消息涉及的设备名。该值可以是协议、硬件设备或者系统软件模块。
Subfacility 它仅与通道接口处理器(CIP )卡有关。详细的信息可以参见Cisco 文档的相关章节。
Severity 它是一个范围在0到7之间的数字。数字的值越小,严重程度越高。
Mnemonic 唯一标识错误消息的单值代码。该代码通常可以暗示错误的类型。
Message Text 它是错误消息的简短描述,其中包括涉及的路由器硬件和软件信息。 下面是一些错误消息的示例。用户可以查阅CCO ISO文档的系统错误消息一节,以查找这
些错误消息的说明。
%DUAL-3-SIA:Route 171.155.148.192/26 stuck-in-active state in IP-EIGP 211. Cleaning up
%LANCE-3-OWNERR: Unit 0, buffer ownership error
需要注意的是,并不是所有的消息都涉及到故障或者问题的状况。某些消息显示的是状态方面的信息。例如,以下消息仅表明ISDN BRI 0接口与特定的远端数据连接。 %ISDN-6-CONNECT: Interface BRI0 is now connected to 95551212