(1)故障是冰山的一角
什么是故障?这对于很多人可能是个太浅显的问题。有人说,故障就是设备丧失了规定的功能,或者不安全了,无法继续工作。这个答案没有错。笔者要给大家一个与众不同的答案:

不知道到底有多少人能够接受这种解释。有人会质疑:“如果是故意,那员工不都成破坏份子了!”。还有人会说:“如果员工正确操作设备,按照规定正确的维护和保养设备,难道设备就永远无故障了吗?”
设备管理的知识告诉我们,设备有自然劣化和强制劣化两种形式。即使在正确的操作和维护环境下,设备也会自然磨损、老化以及性能劣化,我们称之为自然劣化过程。那么,为什么我们还说是人“故意”的呢?
说人“故意”使设备产生障碍这句话不是真理,而是一种理念的表述。就像海尔集团曾经提出:“顾客永远是对的”这一理念一样,这是真理吗?显然不是!难道顾客就永远是对的吗?顾客就没有不讲理的吗?海尔旨在用这种理念来打造一支“不和顾客理论是非”的优秀售后服务队伍。有一次,海尔的洗衣机卖到四川,农民买了洗衣机,洗完衣服,想用它来洗土豆。结果因为土豆里的泥沙、根须将洗衣机堵住不漏水,他们反映给售后服务部门。海尔的服务人员没有责备用户,而是把情况反映到青岛总部。海尔的设计理念是:顾客的需求就是我们的课题。在这样理念下,他们设计制造了漏水通畅的洗衣机,销售到四川,起个名字,叫“大地瓜牌”洗衣机。四川农民十分欢迎,闲时洗衣,忙时还可以洗地瓜,一物两用。据说这款洗衣机还打开了俄罗斯市场,因为俄国人也爱吃土豆。这就是理念的无形作用。
我们说故障是人“故意”使设备产生障碍的,为什么?因为设备就像不会说话的孩子,但会哭叫,也会静坐抗议,有时还会咬人。我们应该将它看成是有生命的,要善待它。只要我们善待它,它也一定会以实际行动来回报我们。从这种意义上讲,才是“故意”的。
故障是什么?故障还是冰山的顶峰,是冰山露出来的一角。大家都看过冰海沉船泰坦尼克的故事,冰山露出的一角很小,一旦被船长发现,船底已经撞到了冰川上。
如果故障是冰川一角,那么什么是冰川下面的内容呢? 图2-25给出很好的启示。
从图2-24中可以看出,尘土、油污、原料附着这些外部的杂质进入设备内部,尤其是摩擦副里,可能造成设备的磨损,接着就是故障。

图2-25 故障冰山下面的内容
设备长时间工作产生的疲劳聚集,就会发生微裂纹,这些微裂纹连接起来就是开裂故障。一个划痕可能导致润滑介质泄漏,接着造成润滑不良,然后是快速磨损,后来就是松动、震动和疲劳应力,后面的结果又与故障联系起来。一些接触不良或者短路,就会影响电气系统的正常。一些材料老化、变形、脆裂就可能导致短路、短路发生。雷电、灰尘、小动物进入系统都会导致电参数的漂移,进而影响设备控制系统的功能。还有就是各种泄漏和变质,都可能造成冷却不良、润滑不良、反应不良等问题,这些都是故障的前因。一些介质的蒸发、挥发,又可能是某类烧焦、发热、融毁问题的前因。311日本大地震和海啸,让福岛核电站不能持续供应冷却水,原有冷却水被蒸发,于是引起爆炸。
由图2-24,我们穿透性的看待故障,还要看到冰山下面的诸多隐患,它们将成为一个个故障的源头。
当然,按照故障的分类,故障还可分为不同专业类型,如机械故障、电气故障、液压故障……;按照性状可分为显性故障和隐蔽故障;按照其劣化过程分为潜在故障和实发故障;按照其来源可分为固有故障和使用故障;按照发生的复杂性又可分为单一故障、并发故障等,这里我们就不详细阐述了。
设备顺畅运行的反面,就是故障。从这种意义上说,设备管理的核心就是面对故障,解决设备故障问题,或者让设备避免和减少故障的发生。
什么是故障?似乎是一个幼稚的问题,却引出这么多值得我们深思的线索。
(2)设备寿命周期的浴盆曲线
设备一生的故障率是变化的,存在着初始故障期,偶发故障期和耗损故障期三个阶段,其形状如浴盆,又称为浴盆曲线,如图2-26所示。

图2-26 设备寿命周期的浴盆曲线
也就是说,新安装设备的故障率比较高,常常出现故障。对于机械类的故障,我们称这段期间为磨合期,在此期间,由于机械的配合、啮合、间隙或者渐开线存在误差,常常会出现运行故障。对于电子、电气类结构而言,这段时期又称为“元件时效老化”阶段。因为新加工成的电子电气系统电参数的不稳定,故障率也比较多。记得早年的计算机组装完成之后,要求客户先插上电源运行72小时,如果这段期间一切正常,就基本可以正常使用了,如果出现故障可以送回到厂家退货。这说明,电子电气类设备也存在着初始高故障率现象。为什么现在很少有电子、电气类设备供应商要求客户要事先插电运行设备呢?笔者到过一些计算机整机厂以及交换机生产厂考察发现,这个过程已经转移到生产企业内部了。在计算机或者交换机出厂之前,都对组装并检验合格的产品进行人工强制老化,如放在高温老化箱或者相似环境插电运行观察,如果检查无任何故障之后才装箱发货。这样,就不会在客户手里出现初始故障状况了。
设备在使用几天,几个月乃至半年之后,逐渐趋于稳定,故障率明显降低或者呈现出周期性故障现象,这就进入了偶发故障期。处于偶发故障期的设备,故障率较低。其故障以两种形式表现,一是规律性、周期性故障,表现在设备某部件或者零件的周期性损坏,如轴承的磨损,密封圈的变形或者腐蚀,法兰的腐蚀泄漏等;另外一种情况是随机故障,其规律性并不明显,发生的部位也不确定,这与设备的设计、制造、原材料或者热处理缺陷有关,也与使用条件、维护保养水平有关。
设备在服役5年至8年之后,开始出现明显老化、劣化倾向。这就意味着进入了耗损故障期。对于机械类设备,包括其总成、部件乃至零件,其磨损、变形、应力微裂纹显现,最后导致设备配合间隙过大,松动、振动、精度劣化、机体开裂等,也就是导致设备功能的丧失——机械故障的发生。对于电子电气类设备,包括其总成、部件乃至元器件,由于长期的外电冲击、冷热变形交替、灰尘的覆盖,散热不良,甚至小昆虫进入的局部短路,导致系统内电气元器件电参数特性发生变化,如电阻、电容、电感变化,甚至烧在芯片中的数字程序变化——电气故障的发生。
我们所说的5年到8年,只是一个大概估计。这和设备的初始可靠性相关,如果设备使用材料好,加工处理恰当,加上使用正确、单班运行、维护保养到位,这一段时间可延长到就10年甚至更长时间;反之,四班三运转或者连续流程设备,维护保养不当,初始可靠性差,也许5年内就进入耗损故障期。
设备的浴盆曲线有点像人的一生。初始故障期相当于人的童年、幼年时期,偶发故障期相当于人的青壮年时期,而耗损故障期则相当于人的老年时期。中年以上的人群通过积极养生和锻炼保持身体健康,是为了自己的“耗损故障期”晚点到来。对设备而言也是如此,良好的维护体系也可以使偶发故障期延长,让耗损故障期晚些到来。
(3)不同役龄阶段的维修策略设计
设备在不同役龄阶段的特点不同,因而其维修策略也应该有不同的设计。
在初始故障期,我们应该注意设备的紧固、调整和状态记录,注意磨合期的油品替换。
在偶发故障期,除了做好常规的清扫、检查、润滑、保养之外,对周期性的损害进行定期维修,同时要导入设备健康管理概念,注意研究设备劣化的源头,加以控制和消除。
在耗损故障期,我们将要对损坏部分做可裁剪式的纠正性的项修组合。如果经过技术分析,发现设备需要淘汰,就要主动淘汰落后设备,引进新设备以强化企业的竞争力。
近年来,国际上以航空系统为案例,对设备故障率进行了统计和研究,发现真正形状为传统浴盆曲线的设备仅仅占3-4%, 有68%的设备只出现左半浴盆的状态,即存在高故障率的初始故障期和较低故障率的偶发故障期,却不会出现高故障率的耗损故障期。按理而讲,设备服役一定年限,故障率一定会上升,为什么不存在耗损故障期呢?答案是,随着设备和制造可靠性的提升,其有形磨损不十分明显,而无形磨损即经济磨损却日益上升。因此,还没进入耗损故障期就被淘汰。面向68%的这样类型设备,如果我们导入周期性的大修理,就会引起每次修理后的初始高故障率现象。所以,国际上更主张取消大修理概念,可以用项修组合来取代大修。
二、设备故障管理
(1)初始故障期的管理要点
设备初始故障期,有点像是设备的童年和幼年时期,常常会生病。一般而言,设备在购进、安装、调试、验收并交付生产之后,就进入了其初始故障期。这段期间,设备的相对故障率较高。
对于以机械为主的设备,这段时期又叫做磨合期。按照设备的磨损曲线,如图2-27所示,在磨合阶段,机械的磨损量较大,由此产生的应力也比较突出。在这段期间,大量磨粒进入设备间隙或润滑系统,污染设备机体。初始的磨合应力过大,可能造成设备损坏,但更可能使得机械零件抗摩擦强度提升,抵御磨损能力增强,这也就带来后续的缓慢磨损阶段。

图2-27 机械类设备或者部件的磨损曲线
对于以电子、电气类设备或者部件为主的设备,也存在着一个初始故障期。在这段期间由于电子元件尚未经过时效老化,会出现某些电参数的缺陷,引起故障。早期我们在购置计算机时,供应商要求用户插上电源工作72小时,如果出现故障就及时调换,就是生产厂用来应对初始故障期的举措。
面对设备的初始故障期,就像是医院要设立小儿科一样,也要做出与之相适应的设备管理举措。
设备初始故障期的主要管理策略如下。
注意磨合期的润滑油品替换:由于磨合阶段油品很容易被磨粒所污染,所以磨合期要加大频度将润滑油脂进行更换。熟悉设备磨损规律的,可以设定合适的换油时间节点。如果不熟悉其磨损规律,建议可以每周或者每日(视工作负荷而定)抽取油样观察,如果发现污染、变黑,就要及时更换。根据设备磨合情况,这样的更换从一次到多次,直到设备进入缓慢磨损期,也就是长期观察润滑油,能够保持较高清洁度为止。有人会说,频繁换油是否太浪费,不符合低碳、环保要求?要知道,设备的损坏所造成的浪费更大。除了生产损失,设备零部件更新、修理的费用所浪费的材料和能源——碳消耗更高。在油品替换上,也要遵循费用有效的基本原则。
注意观察设备运行参数并做好记录:设备运行初期,无论是工艺参数还是设备各零部件的配合均处于亚稳定状况。工艺参数需要随原材料、环境状况而调整,设备内外的各项参数,包括间隙、平衡、位置、温度、湿度、振动、电流状况都可能有一个调整适应的过程。这段期间的检查和记录尤为重要。这些观察和记录一方面可以为今后的调整规范提供数据依据,另一方面可以摸索出参数正常和异常的标准划分,也为未来大检修后的安装提供数据参考。
紧固:有人会怀疑在设备运行初期的紧固有什么作用。其实这一点是不容忽视的。为什么?设备在运行初期,由于一切都是新的,紧固件如螺丝、螺母都是含油的,即使按照要求紧固好了,随着设备的振动,也容易松弛或者脱落。某大型核电站因为一个螺丝的脱落,损失达几千万;飞机的失事就是因为起落架上一个锁紧螺丝的松动脱落;游乐场设施将游人摔落致死,也就是因为某个螺丝的松弛掉落……,这样的例子俯拾皆是,尤其容易在设备运行初期发生。也许,随着时间推移,螺丝有些生锈,反而不容易松动了。所以我们再一次强调,初期的紧固十分重要。
调整:针对设备运行初期的不稳定状况,及时的调整是不可或缺的。除了设备工艺运行参数,对设备的配合间隙、平衡状态、紧固状态、环境温度、环境振动、环境湿度、屏蔽状态、接地状态、负荷状态、产品规格更新后的状态等方面进行及时的跟踪和微调都十分必要。这也是让设备适应生产,生产适应设备的契合过程,同时是积累生产经验的过程。
润滑:新设备的合理润滑同样十分重要,根据设备技术说明书,在不同的部位,采用不同的润滑油脂,按照不同的周期,不同的润滑油脂量,由规定的人员,用不同的润滑方式来加脂加油,这是从设备引进一开始就要确定下来的。而且要有手段来保证这一润滑过程的有效实施。有的设备技术说明介绍的润滑内容不详细或者不准确,那就需要设备使用单位咨询润滑技术专家以设计合理的润滑流程和内容。总之,有机械运动的设备,合理科学润滑永远是十分重要的。
控制生产负荷逐渐达到设计值:从上面的描述可知,新设备需要一个适应生产的过程,无论的电气系统的实效老化还是机械系统的磨合,都需要时日。因此,建议设备运行初期不要达到或者超过设计生产负荷,最好是低于设计负荷运行。当磨合期或者“时效老化”期完成,就可以调整设备到设计规定的负荷了,这对于新设备的保护是很好的措施。
(2)偶发故障期的管理要点
设备的偶发故障期又称为随机故障期。就像人进入其青壮年时期,设备的故障率减少,偶尔发生一些特殊故障,或者周期性、规律性的故障。
设备的偶发故障期一般持续时间很长,大概要持续5到8年时间,甚至更长久,视设备原始可靠性、使用负荷情况、维护保养情况不同而异。
在这段时期,设备故障大体分为以下几种情况:
周期性故障:设备局部、总成、子系统或者零件存在一定寿命周期,使用一定周期之后就损坏并需要更换;
随机故障:无规律而言的故障,可能来自设计、制造、原材料缺陷或者热处理、表面处理不当;
超负荷运行故障:因为超负荷运行,超出设备所能够承受的压力、冲击力、温度、韧性、变形量、连接强度、支撑强度、张力、热强度、电容量、电阻值、电流限度等物理特性,导致故障发生;
误操作故障:编写错误的程序、不协调的动作、操作顺序颠倒、操作不到位、动作过大、过小、错位、违规等。
损坏性维修故障:不良的维修,即维修中发生的安装错位、间隙、对中、平衡不当,装配漏件、紧固失当(过力,不足)、线路错接、破坏性拆卸(磕碰、扭曲、压力变形)等等。
外力作用故障:雷电冲击、过大的外部电流冲击、外部物品掉落撞击、磕碰、地震、洪水浸泡、强大外部磁场干扰、着火、爆炸影响。
前两种类型的故障我们通常称为自然劣化,后面四种称为强制劣化。针对以上故障,偶发故障期应该采用的维修和管理策略为:
常规维护:在偶发故障期,最紧要的是做好常规的清扫、检查、润滑、调整、防腐、堵漏等保养活动,这是一切维修策略的基础。
定期维修:对于那些具有明显耗损周期的部件或者零件,以换件或者换件修复方式为主的定期维修是最好的维修策略。如定期更换损坏的轴承,定期更换被腐蚀的化学品容器,定期更换老化与磨损的轮胎,定期更换老化与变形的密封圈、皮带,定期更换滑丝的螺母、螺栓、阀门,定期更换德尔电气元器件、接头等。
局部深度保养和修理——小项修:针对设备局部缺陷的修理,包括独立换件、更换总成、局部修复(如通过喷涂、堆焊、镶套、刮研、研磨等方式,恢复设备几何精度、尺寸和表面特性等)。
规范操作行为:针对不规范操作的对策,主要是通过纠错防错设计理念,让那些容易出现的失误很难发生,不断完善操作规范、做好员工培训、建立操作规范考核机制,以保证准确无误的操作动作,从而减少因操作不当而引起的故障。
规范维修行为:针对损坏性维修,需要从维修流程的规范性,维修技术标准的准确性和维修验收标准及验收节点的科学性来保证。打破传统自己检修自己验收(自己最不容易发现自己的错误),验收无过程、节点设计,无规范的做法,还要改变维修无流程的随意性做法。
(3)耗损故障期的管理要点
设备耗损期是设备劣化严重的故障多发期。到了耗损故障期,设备的主要总成或者多数总成——部件进入了快速劣化状态,这就像一位已经步入了体弱多病的暮年时代的老人一样。
在耗损故障期,维修管理除了做好常规的保养,包括清扫、点检、润滑、调整、紧固之外,对那些局部耗损劣化严重的部位——总成或者零件组合(线路板,集成块、摩擦副、传动系统、气动系统、液压系统、电控系统、冷却系统、润滑系统、安全防护系统、阀门、接头、气缸、马达、滤网、接地、屏蔽、传感器等)实施纠正性维修。也就是通过换件或者修复再生的方式来恢复设备功能,这是比较常规的维修策略。常用的修复再生方式包括表面喷涂(离子喷涂、纳米喷涂、激光喷涂)、电刷镀、表面镶套、堆焊修补等方式恢复设备几何尺寸和表面性能,以较小的投入满足设备的性能要求。例如,某工厂一台机器曲轴磨损,如果更换曲轴需要15万元,通过纳米喷涂技术将其磨损部位修补,表面精度和硬度均达到原有技术标准要求,使用寿命可以延续6-8年,仅花费了7000多元。这种修复方式非常符合低碳、环保和节能的绿色维修理念。
一般而言,在耗损故障期,不少总成会出现快速劣化状态。
我们并不主张大修理,所谓的大修理,是将设备完全解体,对拆解的零部件进行清洗,对损坏的零部件进行修复或者更换,然后进行部件装配,总体装配,精度调试,空载试车,负荷试车,最后交付使用。当代设备系统是有若干子系统构成的,包括液压系统、气动系统、传动系统、冷却系统、电气控制系统、润滑系统等,每一系统乃至系统上的每一关键零件寿命周期或者耗损周期是不同的。因此,我们很难找到一个共同的耗损周期适于所有子系统或者总成,来对设备进行全部的大修理。因此国际上主张消灭大修理,至少可以用延长大修理周期或者不完全的“大修理”来取代传统的大修方式。因为设备的大修理,经过全部解体总装,重新磨合、新电器元件的重新时效老化,这可能会引导出设备初始故障期的高故障率状况。
面对设备快速劣化状态,我们会采用一种可裁剪、可组合的维修模式。即经过研究论证和设计,将需要修理、换件的内容集合在一起,利用恰当的检修机会,实施这一组合方案加以修复。对于那些无损害迹象的总成或机体,不必解体检查和更换。
对于那些固有故障频发,有条件的企业可以采取主动维修策略。所谓的主动维修,就是不拘泥于原来设备原有结构的小技术改造,其目标并非改变或者增强设备功能,而是将那些固有故障得到根除。
主动维修是以改代修的主动策略,是建立在如下的前提——设备是人设计制造的,不可能是完美无缺的。设备在长期使用中,肯定可以发现一些固有缺陷,也会出现某些重复性的故障,这多少反映出设备在设计思路、设计方案、制造加工工艺、原材料选择或者热处理、表面处理等方面的不足,这些缺陷不足,我们很难通过一般维修方式加以解决。我们可以跳出传统维修模式,大胆思考如何通过不拘泥于原有设计和结构的小规模改造来解决。例如在某处开一个槽,加一个挡板,开个孔、设置一个小机构,或者更换一个不同性能的零件(密封圈、阀门等),将那些固有故障得到根除。
而在耗损故障期,这类主动维修最有意义,等于是给设备一次返老还童的再生机会。例如某些重型机器厂,将传统控制模式下的龙门铣、龙门刨床进行数控改造,不但可以使这些设备加工精度控制水平大大提升,而且让其使用寿命也大大延长。
值得指出的是,并不是进入耗损故障期的设备都是值得进行主动维修的。这就需要通过技术经济分析来决定。如果主动维修的投入加上复利平摊到每年的费用,再加上年均维护费用超过了设备更新投入平摊到每年的费用,再加上年维护费用,则主动维修就没有必要,而设备更新则更加经济。反之,就值得进行主动维修。
(4)设备健康管理
我们建议企业在设备偶发故障期阶段,应该积极引入设备健康管理理念。
根据设备健康概念,设备分为三类技术状态:健康—亚健康—故障。设备的使用寿命是由健康——亚健康——故障——报废,即由量变到质变的动态过程。
传统设备管理,着眼于质变管理,即故障管理和静态维修,形成了故障发生后(预知的或已发生的)故障诊断和停机解体换件修理的维修模式,其特点是阶段性恢复和保持健康。设备健康管理着眼于量变管理,即健康和亚健康状态的监控。注重机械微观和动态损伤过程的演变、特点、规律摸索,做好事前预防、过程监控、动态养护维修。
“设备健康管理”是医学、仿生学在设备管理与维修科学中的运用,针对机械设备的现状,健康管理提出了“保持设备健康与控制亚健康”的要求和对策,设备维修提出了“状态监测与动态维修”的要求和对策。
由于科学研究和制造工艺技术发展的阶段性,目前的在用设备从设计、制造、运用条件、结构性能等方面到管理水平、维修模式与技术方面都存在着诸多缺陷,设备在运用中受到各种因素的破坏而不断由健康劣化为亚健康,再劣化为故障。
典型的健康管理案例是某港口的进口柴油机采用“润滑油滤清、燃油滤清、冷却水滤清和空气滤清”这“四清”方式,将设备劣化源头控制在萌芽状态,使设计寿命为30000小时的设备运行100000小时零故障。如果这些工作是费用有效的,这不失为经济的维修策略。
另外,“橡胶密封件弹性恢复剂”能够有效的使老化和硬化的密封件得到恢复,大大延长使用寿命,将其纳入设备的养护模式和工艺规范,形成保健制度,将有效延缓橡胶密封件老化过程,延长更换周期,减少技术隐患和经济损失。
采用“电器防护技术”及相关产品,对各类电器、传感器进行防护处理,能大幅度提高其使用性能,保障应用稳定性,数倍延长使用寿命。
自修复润滑油运用医学仿生学的原理,以建立设备预防、保健、康复的仿生机能和健康机制为目的,是模拟“血液”机能特点的新型润滑油。它能自动修复机件摩擦副表面的损伤,再造抗磨减摩耐腐蚀的复合金属表面,改变和控制机件摩擦学行为,恢复和长期保持机件设计结构和良好性能,节省燃油,减少排放,减免维修,数倍延长机械和润滑油的使用寿命,显著节省运用成本。同时,还将传统润滑油的润滑、密封、散热、防腐、清洁的功能进行了质的提高。
这些都属于健康管理的很好案例。
如图2-28所示为设备故障管理到设备健康管理过渡的示意图。

图2-28 设备故障管理到设备健康管理过渡的示意图
三、设备故障消减——“零故障”管理
(1)预防维修的具体模式
预防维修的提法已经几十年了,那什么是预防维修呢?
预防维修有两种具体模式,一是定期预防维修,就是按照设备耗损周期计划安排的停机检修;二是状态维修,就是对设备状态进行监测,发现故障隐患或者潜在故障,及时安排适时维修,将故障消灭在萌芽状态。
预防维修的另外一种形式是机会维修,即利用生产的淡季、假日、周末或者上下游停机检修的机会进行的预防性维修。机会维修的“机会”可以是适当延长检修周期,也可以是适当的将检修周期缩短,经过论证,这种延长或者缩短是不会对设备造成重大损坏的。这样的预防维修也称为机会维修。无论是采取何种预防维修方式,都是在设备故障停机前的处理,目的是避免故障的发生。
(2)开展预防性维修的重要意义
到底预防维修好在哪里呢?
1)可以减少和避免非计划停机
当今企业多数按照订单来组织生产,客户对交货期的要求十分严格,在精益生产企业,准时化、零库存成为典型特征。一旦因为设备停机影响某一生产工序,这个订单就会受到影响,这对企业效益、信誉都会有很大伤害。通过预防性维修,避免大量非计划停机,保证准时交货,其意义重大。
2)可以减少设备的连锁损坏,延长设备寿命
设备损坏往往是从局部或某个零件开始,这个局部或者零件又影响了其他局部或者零件,一步一步传递,最后酿成大问题。这是系统的多米诺骨牌现象。预防性维修可以减少或者避免轻微损坏,或者将小隐患及时消除,避免影响扩大,最后导致更严重的故障损坏。
3)可以降低维修成本
当然,不当的“预防维修”不但不会降低成本,还会增加成本,我们称之为维修冗余或者维修过剩。我们这里是指恰当的预防维修可以降低维修成本。一般而言,有计划的工作其效率是无计划工作效率的3倍到4倍。预防性维修因为其计划性,可以事先研究修理方案,准备好图纸、工具、吊具等辅助设施材料,准备好备件。一旦解体维修,可以高效完成维修工作。反之,如果是事后维修,人们在突然停机的匆忙之中诊断原因,再寻找工具、备件、材料,真正的维修需要半天,而前期的准备可能会是一天半到两天,时间效率的降低明显,维修成本自然增加,加上事后维修可能造成的连锁损坏,换件损失也会增加,更加大了维修成本。
4)可以降低安全事故风险
预防维修可以将设备局部的、轻微的或者初发的缺陷加以消除,这样可以单独降低安全事故发生的风险。1984印度中央邦的博帕尔市的美国联合碳化物属下的联合碳化物(印度)有限公司设于贫民区附近一所农药厂发生氰化物——异氰酸甲酯泄漏,引发了严重的后果。大灾难造成了2.5万人直接致死,55万人间接致死,另外有20多万人永久残废的人间惨剧。如果能够掌握正确的维护保养和实施到位的预防性维修,也许不会酿成如此严重的惨剧。
5)可以避免和降低批量的质量缺陷或者报废
很多设备在故障的过程中,会造成大量的质量缺陷或者报废。一台连续冲床故障之前可能将几百件冲压件压坏;钢厂的连铸连轧生产线在故障停机之前可能让几百米的钢材出现轧制缺陷;在反应釜中化学合成的物质在设备故障中因为反应不完全而报废,甚至造成设备清理的困难……,这样的例子很多。因此,预防性维修可以从某种程度上减少或者避免故障期间的批量质量劣化或者报废,减少因为故障——报废造成的经济损失。
6)可以使得工作更主动,更有计划性和预见性
预防维修中的机会维修可以使得工厂的生产计划、工作时间安排和资源配置更加合理,更加有计划,也就更加主动。有的工厂实施的夜班检修,周末检修,月末检修就是利用生产任务完成的间隙所进行的机会检修。很多钢厂实施的同步检修也是利用上下游停机间隙所进行的机会维修。饮料、冰箱、冷柜、空调生产企业夏天生产任务紧,冬天较为清淡,可以将预防维修尽量安排在冬天,卷烟行业冬天任务紧,夏天稍微轻松,可以将机会检修安排在盛夏。当企业维修任务紧时,可以适当调节维修间隙,以便有效的利用维修人力和设施资源。总之,机会性的预防维修可以让工作的计划更灵活。
7)降低环境破坏的风险
与降低安全伤害一样,预防性维修可以有效的降低环境破坏风险。设备,尤其是牵涉到有毒气体,液体的设备泄漏会造成环境破坏;设备的噪音也会污染环境。企业内部的水处理、空气净化设备直接关系到对排放环境的影响。
8)有利于节能降耗
设备不良运行,往往会增加摩擦和能耗。预防性维修可以保证设备、设施的流畅平稳运行,可以有效降低能耗,维持设备的节能效果。
(3)如何认识事后维修?
我们已经给预防维修评功摆好了那么多条,预防维修是不是总是对的?事后维修是否还有存在必要?
有人说,事后维修不可避免,所以才有存在必要。那么请问,有没有一类设备,我们只对它们做事后维修而从来不做预防性维修?答案是肯定的。
对于故障后果不严重的设备,事后维修是最经济合理的维修策略。
那么,什么样的设备故障后果是不严重的呢?
1)故障后对上下游的工作影响不大,除了设备本身有限的停机,不会造成较大的停产经济损失;
2)故障后不会造成人身安全伤害;
3)故障后不会造成环境和职业健康危害;
4)故障不会造成设备的连锁损坏,以至于发生较高的维修和换件费用。
如果故障后果属于上述状况,事后维修就是最好的策略。因为事后维修可以最大限度的延长设备的有效使用时间,充分发挥设备效率。虽然事后维修本身的工作效率会有所降低,但综合平衡起来,还是划算的。
在工厂里,什么样的设备适于做事后维修呢?
1)离散、相对独立的设备,停机影响限于自身;
2)非关键、瓶颈设备,停机后对上下工序影响不大;
3)结构简单、可维修性较好的设备;
4)非主流程、辅助、有备机的设备;
5)无法进行状态监测、无故障先兆,暂时无法预知故障的设备(以电子类设备居多)。
(4)什么是“零故障”管理
让我们回到主题,什么是“零故障”管理呢?这要建立在以下的理念之上。
n 故障是可以预防的;
n 零故障是可以逐步实现的;
n 点检状态监测是预防维护的重要手段;
n 人-机和谐才能有效预防故障;
n 过程比结果更有意义。
(5)应对“零故障”的具体对策
一般而言,设备“零故障”状态水平越高,越可以使生产损失减少,使设备本身损失减少,所以设备“零故障”是很多企业追求的目标。实现设备“零故障”的具体对策如下,如图2-29所示:
1)保持设备的初始和基本状态,维持设计原始参数;
2)严格遵守操作规程,防止和避免破坏性的操作,防止和避免超负荷运行;
3)不断地发现、防止和修复自然劣化,让设备在潜在故障状态就得到修复;
4)纠正有缺陷的设计,对设计制造缺陷进行附带改善的主动性维修;
5)防止人为劣化,避免人为损坏,防止损坏性维修;
6)控制任何非正常的外部条件,控制对设备劣化的加速因素作用。

图2-29 设备零故障对策
(6)开展“零故障”管理的工作流程
针对设备的故障发生,我们设计了“零故障”管理流程。如图2-30所示。

图2-30 设备的“零故障”管理流程
仔细分析,上述流程不过是PDCA流程的延伸。上述流程旨在针对设备的频发故障,组织课题攻关,步步深入来解决问题。上述的循环可能会反复多次才能让故障趋近于零。其中,贯彻了TOP2管理思路,这也就是二八分布率,抓住最主要的前两位原因加以解决,就控制了大部分的故障停机。之后会有新的前两位故障凸显出来,继续不断的加以解决。直到我们“零故障”目标的实现。
“零故障”管理的难点在于找到故障原因的解决办法,这需要反复试验,也许会面对不少失败,甚至会涉及设备的先天不足和主动维修策略的运用。对原设备的结构、材料、处理工艺加以改动,从根本上解决问题。