跳转到内容页面 中国 — 简体中文
HP.com 主页产品与服务支持及驱动程序解决方案如何购买
» 与 HP 联系
 
ProCurve Networking by HP ProCurve Networking by HP

信息库


局域网性能和间歇连接问题解答
 

»

ProCurve Networking by HP

»

为什么选择 ProCurve?

»

最新资讯

»

产品与解决方案

»

产品服务

»

技术支持

»

软件更新

»

网络培训

»

设计中心

»

参考资料

»

客户成功案例

»

新闻信息

»

联系 ProCurve

简介
性能和断续连接问题属于最难以解决的网络问题。如果要将这些有关的标题都罗列出来的话,这足以编成厚厚的一本书。本技术说明采用针对故障排除的方法确定与以太网(10Mbps、100Mbps 和 1000Mbps)集线器(转发器)、交换机和路由器有关的此类问题。

本文没有详细解释如何确定从整个网络停机到局域网设备问题的原因,而是假定您有理由怀疑局域网设备,或者您希望局域网设备能够帮助您找出问题。这方面的一般性指导请参阅下面的“缩小问题的地理范围”。

关于丢包问题
网络设备鲜少会出现由于转发包时速度减慢以致于性能受到严重影响的问题。恰恰相反,局域网上比较严重的性能问题通常与丢包导致的端结点超时和这些包的重新传送有关。每一次重传通常会造成秒级的延时。数千次这样的延时就会导致最终用户能够感觉到并且抱怨连连的网络降速传递。

同样,如果传送持续作用的数据包丢掉太多,也会中断连接。

注意:尽管网络运行感觉可能很慢,但局域网设备通常都在全速运行。也就是说,局域网设备正在快速转发包。丢包导致网络变慢的原因在于冲突过多,或者共享媒体网络自然发生的高冲突率产生的延时。

丢包的一个主要原因是网络拓扑结构本身的设计。例如,如果 20 个 10Mbps 客户机都试图向 10Mbps 服务器发送数据,并且都通过交换机连接,即使网络设备没有故障也会丢包。

缩小问题的地理范围
如果性能问题牵涉到一个或多个 WAN 链路或防火墙,那么首先应当从网络的这方面着手。WAN 和防火墙比局域网的可能性更大。

在确定特定局域网内的性能问题时,首先应当尝试找出问题是出在局域网的某一部分上还是在通过局域网的某条路径上。也许您已经做过这样的检查了,如果您怀疑原因出在网络上的话。如果还没有缩小问题的范围,您可以通过对网络不同部分的数据操作(例如文件传输)进行计时来缩小问题的范围。

另外一个重要工具是 ping。一个正常运行的网络应当能够成功(即没有超时)执行几千次 ping 命令。

查找丢包
一旦怀疑某个网络设备或少量网络设备有问题时,应通过网络管理或者设备的 Web 或控制台界面获取它的错误计数器(数据统计)。然后,查找丢包。

计数器可能非常明确地用如下名称指出丢包,例如:Drops Tx Drop Rx Frames Dropped。

丢包还可能更间接地表示为与介质有关的故障,例如下列以太网错误:FCS error CRC error Alignment Rx Runt Rx Short Event Giant Rx Too Long Rx Late Collision Tx Excessive Collision Tx Late Events Excessive Deferrals Tx,Babble error Loss of Carrier

当出现其中的一个错误时,集线器、交换机或路由交换机就会丢弃有关的数据包。重发包由源端结点传输层(例如 TCP)来负责。

多少错误才算过多?
CRC 错误、定位错误和 runts 等数据链路错误都会出现在正常运行的网络上。如何判断这些错误是合理还是数量过多?根据经验,5,000 个中出现一个错误属于正常。例如,每 5,000 个数据包的平均接收错误(CRC,定位,runt,短,大,或者太长)不应超过 1 个。每 5,000 个数据包的平均传输错误 (late collision,excessive collision, late event,excessive deferral,或者 loss of carrier) 不应超过 1 个。当错误率较高时,用户将查觉得到网络性能变差。

5,000 分之一的数据链路错误并不一定表示网络运行完好,而是表明这些错误可能不会产生用户能够察觉到的严重性能问题。

其它链路级性能问题
以太网也有一些错误,除非发生太频繁,否则属于正常的情况。例如:冲突、超时传输和碎片。有冲突是正常的,但是相对于数据包的传输总数而言,有冲突的数据包数量不应很大。大量的冲突、超时传输或碎片都会导致网络的传输降速。遗憾的是,“频率太高”或“大量”的范围很难定义。

设备的 LED 或事件日志可能会显示出自动分区或失去链路等链路级问题。设备配置改变时链路丢失属于正常现象,因此出现几次链路丢失是可以接受的。如果多次出现链路丢失,则表明可能出现线路连接故障、网卡损坏、收发器损坏、或者端结点关闭。

非以太网链路的错误类型与其它的链路不同。HP ProCurve 设备上的 Fault Finder 功能可能已经通过设备的 Web 界面或事件日志报告了其中的某个错误。

网络设备缓冲区问题
缓冲区问题一般是网络拓扑结构不适合网络上的流量模式所导致的结果。例如,使用 10Mb 主干线互连交换机会频繁地导致除最小网络之外所有网络上的堵塞(和缓冲区问题)。为了解决这个问题,交换机到交换机和交换机到服务器的连接应当比客户机的连接速度更快(例如 100Mb)。

局域网设备可能通过报告与系统相关的问题指出丢包,例如:Packet Buffer Misses Message Buffer Misses Buffer 错误 Lack Of Resource 错误

这些错误一般表明发生了丢包现象。

一、两次偶尔的丢包不会对性能产生明显的影响或导致连接失败,但是如果某条链路或电缆上的丢包每分钟超过 1 个,这可能就是问题的根本所在。

解决丢包问题
找到丢包位置,实际上就等于找到了问题的根本所在,也相当于解决了一半的问题。

本文未介绍如何查找根本原因,也没有给出解决的方法。一般来说,下一步就是要解决丢包的根本原因。这可能涉及网络设计、电路故障、收发器故障、网卡故障或全/半双工不匹配等配置问题。例如,下列配置会导致严重的网络问题:

10/100 集线器、交换机、路由器等,端口配置为自动协商,端结点配置为 100Mbps/全双工或 10Mbps/全双工

集线器、交换机或路由器可以正确地检测(不是自动协商)10Mbps 或 100Mbps 速度。由于端结点配置为特定的速度和双工状态,因此它不会协商,集线器、交换机或路由器将选择 802.3u 标准规定的通讯模式(即半双工)。

如果一个设备半双工运行,而连接另一端的设备全双工运行,在流量水平较低时这样的连接能够正常地工作。当流量水平较高时,全双工设备(在这个例子中为端结点)将遇到不正常的高 CRC 或定位错误率。端结点通常将这种情况描述为“Performance seems to be approximately 1 Mbps(性能大约为 1 Mbps)!”。通常,端结点将会失去与服务器的连接。

对于 ProCurve Fault Finder 报告的错误,您应当查看联机帮助,它会提示可能的(尽管不是全部)根本原因。下面是几个实例。
计数器可能的记录根本原因
Bad CRC 或 Alignment半/全双工不匹配,或者驱动程序、网卡或收发器或电缆故障
Giant驱动程序或网卡问题
冲突通常流量太大,以太网无法处理。在极少的情况下可能是电缆、网卡或收发器故障导致的
Giant 或 Runt网卡、网卡驱动程序或收发器故障
自动分区网络回路或超时传输,网卡、网卡驱动程序、收发器或电缆故障
Frame Dropped,Drop Tx,Drop Rx,Buffer Overflow流量大或网络设计问题
Jabber电缆、网卡或收发器故障
其它信息源
一定要参考您产品手册的故障排除部分,这是一个有价值的信息源。另外,请查阅 ProCurve Networking by HP 网站上的常见问题和白皮书。

打印版
保密声明 使用本网站表示您同意其使用条件
© 2005 Hewlett-Packard Development Company, L.P.