2024年4月24-26
上海世博展览馆

单元可靠性设计

2021年1月11日

控制与接口单元是指能独立完成某些测控功能的功能模块,其可靠性设计主要包括微处理器系统的冗余设计、输入输出通道干扰的抑制、电源系统干扰的抑制、控制单元运行状态的监视等。那么今天国际电子展小编就和大家来聊一聊。

 

(1)I/O通道干扰的抑制

 

模拟量输入通道常态干扰的频率通常高于被测信号的频率,因此可考虑采用滤波网络对模拟量输入信号进行滤波。可采用各种形式的金属屏蔽层做好信号传送线路的屏蔽工作,将信号线与外界电磁场有效地隔离开来;在系统既有模拟电路又有数字电路时,数字地与模拟地要分开,然后只在一点相连,以防相互干扰。I/O通道一般应采用光电耦合器进行电气隔离,既可避免构成地环路,还可有效地抑制噪声。另外,在输入输出通道上应采用一定的过压保护电路。

 

(2)电源系统干扰的抑制

 

同一电源网路上有较多大功率设备时,在控制单元与供电电源之间可加入三相隔离变压器,以防止电网干扰侵入控制系统。在整机的电源线入口处,可通过增加电源滤波器来防止其他电子设备与本系统之间产生相互干扰。在机内独立的印刷板上应安装小型电源滤波器,以防止板与板之间的相互干扰。

 

由于开关电源具有较强的抗工频电压波动和频率波动能力,同时能隔离从电源线进入的传导干扰,适当场合可选用开关电源。必要时,系统输入输出通道和其他设备可考虑采用独立的供电电源,实行电源分组供电。另外,逻辑电路板上的直流电源线和接地线要注意合理布线。

 

(3)控制单元运行状态监视

 

可使用看门狗定时器(WDT)监视控制单元的运行状态。WDT的输出直接连到CPU的中断请求端或控制单元的复位端,WDT的每次“定时到”溢出脉冲信号均能引起CPU的中断或复位。WDT受CPU控制,可对其重新设置时间常数或刷新。

 

定时器重新开始计时,只要程序正常运行就不会产生定时中断或系统复位。一旦程序执行出错或发生程序乱飞、死机现象,看门狗定时器就会产生溢出脉冲信号,引起定时中断或复位,从而使控制单元重新启动或进入中断服务程序进行纠错处理。

 

(4)控制单元的掉电保护

 

对付电网瞬间断电或电压突然下降的有效方法就是掉电保护,对计算机测控系统可外加不间断电源(UPS),对测控系统中的控制单元可增加掉电保护电路,并慎重设计。掉电信号由硬件电路检测,加到控制单元CPU的外部中断输入端。软件中断将掉电中断规定为高级中断,使控制单元CPU能及时对掉电做出反应。在掉电中断子程序中,开始进行现场保护,保存当时重要的状态参数。当电源恢复正常时,CPU重新复位,恢复现场并继续未完成的工作。

 

(5)控制单元冗余设计

 

常用的控制单元冗余设计包括热备份并联冗余和冷备份并联冗余,两者都是以增加成倍的硬件投资来换取系统硬件的可靠性。

 

(6)热备份并联冗余是将若干功能相同的控制单元并联运行,同步执行相同的处理程序,当并联系统中至少有一个控制单元工作正常时,整个系统即维持正常工作。

 

为了提高控制单元的可靠性和经济性,常采用双机热备份并联方式。对受控系统而言,双机热备份并联方式只是其中一个控制单元完成测控任务,另一个控制单元处于并行工作的待命状态。但两个控制单元同步执行同样的程序,一旦自检系统发现主控单元有故障时,则待命状态的备控单元自动切换上去,代替主控单元使系统继续正常运行。在设计双机热备份系统时,要解决以下两个主要问题:

 

1)双机同步。双机同步一般是以事件作为同步令牌,其中事件可由设计者定义。如系统的工作过程为:输入接口采集由传感器送来的数据,在CPU内将采集到的数据和设定值进行比较、处理,然后得到本次的控制量输出。那么,事件可划分为数据采集和数据处理两个事件。

 

当应用系统启动时,两机同时执行事件,即采集状态数据。当一个事件完成后,再将两结果进行比较,如果相同则继续第二事件;若有错误,则主控单元自动切换,用备控单元代替主控单元。只要主控单元工作正常,则备控单元一直处于待命状态。

 

当事件进行数据处理时,若超出精度范围,则认为其中一个数据可能有错误,这时可以让双机重新转到本事件的地址再执行一遍。若仍有差错,则再转到故障检测程序。这种软件回卷方法可以消除某些偶然性因素的影响。

 

2)故障检测。可以利用两机各自的自检程序分别进行自检,找出发生故障的控制单元。如果故障机是主控单元,则可进行自动切换,使程序继续执行下一个事件。为了能及时切换,可以根据任务的特点多设置一些事件,使得双机同步校验次数增多。

 

所谓切换是指通过输入输出接口相互交换双机状态,一旦某控制单元出错,另一控制单元就可及时知道。当备控单元发现主控单元有故障时,就可以发出控制信号,使主控单元自动退出控制,备控单元代替主控单元使系统继续正常运行。

 

(7)冷备份并联冗余设计中,备份的控制单元平时不加电工作,只在发现主控单元出故障时才用其代替主控单元。冷备份的控制单元在硬件结构、软件实现上都与主控单元完全一样,各种联机设备都安置到位,处于接通电源即可投入正常工作的冷备份状态。

 

冷备份并联系统中的冷热切换可以用人工操作转换,也可以自动切换。在设计成自动切换时,主控单元必须设置各路(或关键几路)报警信号。国际电子展小编提醒大家,若发现超限现象,则及时输出切换信号去触发冷备份系统的电源触点,使备份单元投入正常运行。

 

 

来源:来源:可靠性技术交流