煤矿智能开采已成为煤炭工业发展的必然趋势,自主采矿系统、机器人集群、人-机协同的应用显著增加,区别于传统应用的操作规范,新技术将会带来新的潜在危险,必须建立一套完整的自主采矿安全体系。《自主采矿系统安全白皮书》旨在为在煤炭开采企业提供全面、系统、安全的作业方法。
自主系统是指可应对非程序化或非预设态势,具有一定自我管理和自我引导能力的系统。相比自动化设备与系统,自主性设备和自主系统能够适应更多样的环境,完成更广泛的操作和自主作业,应用传感器和复杂软件,使设备或系统在较长时间内无需通信或只需有限通信,且无需其他外部干预就能够独立完成任务,并在未知环境中自动进行系统调节,保持过程性能优良。自主机器是指能够自主决策和执行任务的机器。自主机器不仅具备智能化的功能,还可以根据环境和任务需求自主决策和行动。自主化可以被看作是自动化的外延,是更高级的自动化和智能化。
笔者讨论了露天矿和井工矿井对自主采矿系统的应用,该系统适用于自主机器、半自主机器,以及整个采矿行业的复杂系统集成。通过对《自主采矿系统安全白皮书》进行编译及解读,旨在提高从业者对系统安全的认识,使从业者对安全高效自主采矿系统有更深刻的了解。
自主采矿系统安全背景
20 世纪中期,核能、民用航空、国防等工业发展迅速,各工业系统通常由多个子系统集成,因此整个系统庞大而复杂,亟需一系列保证系统安全的方法。依靠经验学习和管理这些复杂的系统是不现实的,系统之间协同工作至关重要,缺乏系统兼容性的考虑,较易导致意外事故发生。
系统安全是将系统工程和系统管理应用于危险、安全和风险分析的过程中,以便在设计或修改系统、产品或服务时,识别、评估和控制相关危险,其目的是减少或消除在生产、施工或运营过程中发生事故的可能。系统安全是超越机器本身为解决复杂系统(包括人、机器、环境和管理以及他们之间的相互影响) 的安全性问题而开发、研究出来的安全理论、方法体系。系统安全的最终目标是降低实施的风险,是一种有计划的、有纪律的、系统的方法,通过对整个系统生命周期进行分析、设计和管理从而识别、分析、消除和控制危险。
工作场所系统安全
从工作场所安全的大背景来看,系统安全包括3 个层面,如图1 所示。
外层是监管层,通过立法和普通法表达了社会对安全运行环境的期望。
中间层是支持系统安全运行的组织层,包括:①运营风险管理,评估和管理运营风险,尽可能降至合理可行的水平;②应急管理,确认紧急事件的潜在后果,并准备好有效的应对措施;③安全文化,努力在组织中建立一种知情、灵活、公正的安全文化,从错误中吸取教训,并作为日常绩效的一部分推动安全改进;④变更管理,确认实施的每项变更都经过评估和批准,确保系统的安全运行。
内层提供了安全运行系统的一张整体视图,包括5 个方面:①功能安全提供系统的安全框架,为交付和维护安全相关和安全关键控制措施提供保障;②技术合规性是指系统需要符合与其操作环境相适应的现有法规和标准;③系统集成是指系统安全集成的要求,因为系统各组件不会考虑子系统之间的相互作用;④人为因素是指人与其交互系统之间的关系,包括性能、人体工程学和其他环境或物理因素;⑤危险材料是指对储存、搬运、运输和管理危险材料的要求,如果人员暴露在危险品中,可能会对健康产生影响。
采矿特定利益和注意事项
对于在整个供应链工作的个体,包括提供产品和解决方案的个体,以及在矿山的整个生命周期中操作和维护系统的个体,安全是采矿的优先任务。在许多情况下,风险不能完全消除,这是提高安全的一个关键考虑因素。当与之相关的风险降低到可接受的水平时,则认为是安全的。自主系统等技术进步可以通过将个体从危险情况中解救出来,从而降低作业风险。
在采矿系统向自主采矿系统的过渡时,除了机器自动化之外,需要考虑许多安全方面,包括:①动态运行条件(如倾倒场、新矿区);②单供应商或多供应商梯队;③手动操作和自主设备环境的集成;④自主系统的交互操作。
系统安全方法提供了超越机器范围的系统整体安全,可作为评估整体安全的有效定性工具。随着高度自治和高度集成的解决方案的发展,这种方法显得尤为重要。
使用系统安全方法的优点:①提供一种将自主系统集成到矿山现场的整体安全方法;②降低工程风险;③能够识别由设备接口和互连带来的危险;④允许评估非确定性、复杂系统和使用新技术的系统;⑤协助加强安全文化。
自主采矿系统安全管理
安全管理是指管理可能带来危害风险的变更。对于自主采矿系统,安全管理需要考虑所有相关因素,确保采用自主系统的风险尽可能低。
生命周期
自主采矿的系统安全活动贯穿整个系统生命周期。图2 描述了自主采矿系统的安全生命周期,展示了系统安全管理的各个关键方面。表1 提供了整个系统安全生命周期的各阶段应对措施。自主采矿系统生命周期各个阶段可以进行持续改进,在运行过程中可以自主迭代升级。
因为采矿作业中自主系统的每个应用都不同,所以系统安全生命周期评估方法也不相同。可能影响生命周期应用的一些因素包括该系统是商业现货还是新产品开发、项目规模、运行环境和矿区运行的成熟度。
危险源识别和风险评估
识别与变更过程的危险,确保针对每个危险采取预防措施是进行变更时的重要步骤。对于轻微风险,这一步骤对应的方法是证明风险产生的概率小,不值得考虑。
自主采矿系统中自主机器和系统的风险与控制可在原始设备制造商文件、国际标准或其他行业指导和研究中发现。所采取的预防措施应反映法律、政府指导、法规和标准的规定。如果风险较低,并且完全被公认的权威机构发布的要求所覆盖,则证明遵循了这些要求,就足以证明该风险是可接受的。
在确定参考标准已经足够之前,应确保:①该设备正按照预期使用;②该标准可使风险降低到合理可行的最低水平。
在对采矿中的自主系统进行变更时,新系统可以提高整个系统的安全性,并降低所识别的任何风险。
非确定性的系统元素和机器学习
自主采矿系统可能具有非确定性元素,这意味着决策来自复杂的传感器和处理算法或涉及机器学习。传统的安全标准以及传统的软件开发过程可能不适用于这些情况。
越来越多的复杂功能正在使用机器学习进行开发。这些能力从示例中学习,而不是通过传统的开发手段,这可以使其具有成本效益。当机器学习被用于某些系统软件时,将会对系统安全生命周期及其保障产生影响。
机器学习生命周期具有高度迭代性,因此难以清楚地将其映射到正常的安全生命周期中。输入需求可被认为是可比较的,机器学习生命周期的其余部分无法实现从定义到验证和确认的清晰过程。但在实际环境中部署系统的测试可能会提供支持验证和确认的数据。在实践中,与传统的生命周期相比,机器学习很可能使产品和应用程序之间的区别更加模糊。
目前,使用机器学习评估系统的安全性还没有形成标准。虽然关于采矿和采石以及自动驾驶道路车辆等相关学科的标准制定工作正在进行,但是在可被广泛接受的标准出现之前,还需要一段时间。在此期间,基于风险的管理方法是管理整个系统安全较为合适的方法。
自主采矿系统安全应用案例
部署自主采矿系统的安全案例的目的是传达一个明确和全面的论点,即一个系统在特定环境下运行是安全的,从而提高完成工作的保障。此论点可能有多个内部和外部利益相关者参与, 包括监管者、矿山运营者、原始设备制造商和供应商、技术集成商。
应用安全案例的方法是“无缝开发”,即在项目开发期间的几个阶段引入安全案例。安全目标的早期识别允许自主系统设计和应用随着系统开发的进展而改变,以建立一个更令人信服的安全案例。安全案例的开发可能会根据自主系统是定制系统还是商用系统而有所不同。
在自主系统开发生命周期的不同阶段,提出了3 个版本的安全案例:①初步安全案例,在定义和审查系统规范后;②临时安全案例,初始系统设计和初步验证活动后;③操作安全案例,在投入使用前,包括满足系统要求的完整证据。
在其他行业中,通常使用子系统安全案例的汇编来支持整个应用程序或系统及其自身的安全案例。这为各方之间安全论证提供所有权优势。
人-系统集成
自主采矿系统安全工程采用一种综合的方法用于识别、消除或控制系统生命周期中人和环境影响的风险。了解人在系统中扮演的角色对于实现系统安全至关重要。人-系统集成是跨学科的技术和管理过程,用于将人的因素集成到所有系统元素内和跨所有系统元素中。在自主系统的采矿作业中,与人−系统集成相关的维度有5 个:①人员配置,决定操作和维护人−系统所需人员配置的数量和业务能力;②人员培训,评估和培训人员以获得人−系统安全作业所需的能力;③人为因素,系统设计、开发和评估中的人类潜能和能力底线;④安全因素,包括传统的风险分析和评估技术,如危险和可操作性研究、保护层分析、失效模式和影响分析,以及以系统为重点的风险分析技术;⑤职业健康,通过预防、缓解和适应危险的工作条件,保证员工的身体、心理健康。
人−系统集成在更广泛的系统设计过程中包含了以人为中心的分析、设计和评估。人−系统集成是一个持续的过程,应在任何自动化项目概念提出阶段开始,并在整个系统设计过程中持续改进,包括测试和评估过程中,反复验证是否实现了安全目标。
在采矿中引入自主系统的人−系统集成包括:①操作和场景开发概念;②任务分析;③人与自主系统之间以及人与人之间的功能和角色分配和定义,包括培训和能力评估需求分析;④迭代式概念设计和原型设计; ⑤ 实证测试(如人工循环模拟);⑥运行期间人−系统性能监控。
人为因素与人-系统集成之间的关系
在考虑系统安全中自动化和人−系统集成的目标时,还需要考虑与人−系统集成有关的人为因素问题,包括工作设计、工作场所布局、工作量、沟通手段、决策权、培训、技术和系统组件。
人为因素评估也可以揭示由人−系统集成而引入的压力源,这些压力源在短期内可能不会暴露为健康风险。其他影响员工的生物因素也会对健康造成影响,如糖尿病、肠/肾/肝病和抑郁症等。这些健康因素应在人−系统集成风险评估中予以考虑,但因其是长期发生的,可能有多种促成因素,通常会被忽略。忽略这些问题的风险包括:①生产力下降;②流程中的变通方法(尤其是在涉及关键绩效指标的情况下);③劳动力流失率;④旷工现象;⑤职工薪酬的增加;⑥员工满意度下降影响工作场所文化。
软件安全管理
自主采矿系统通常是软件密集型的,并且越来越多地使用软件来执行目标检测和回避的关键安全功能。有几个软件的安全控制因素会影响风险降低的程度。如软件开发生命周期、软件的语言和操作环境、测试方法和文档的完整性,以及参与软件开发和维护的人员的能力。
发展自主采矿系统
为了保证风险等级的降低,软件安全标准制定包括以下6 个方面:①对软件组件的要求进行制定和评估;②软件组件应用的语言和运行该组件的操作系统;③该组件中未确定的方面;④组件功能的验证、测试的完整性、测试的适当性;⑤组件的审查和审查者的不相关性;⑥软件组件本身与其他安全软件控件的独立性。
操作自主采矿系统
操作自主采矿系统需要开发和实施软件安全管理,需要考虑的关键点包括:①为实现自主系统提供有效的培训环境,使现场能模拟更多环境;②与利益相关者进行有效沟通,管理自主系统的运行;③在软件升级后进行所需的验证测试;④限制授权人员访问的管理;⑤变更管理,跟踪系统配置变更的所有方面、记录变更的细节、更新操作程序、验证程序和复盘程序;⑥恢复程序,包括故障分析,以确定是否存在不可预见事件(如雷击或硬件故障)。
结 语
笔者介绍了在采矿中引入自主系统时需要考虑的系统安全概念,提出实现系统安全实施所要关注的主题,强调了煤炭开采目前面临的挑战,未来需要为应用于采矿中的自主系统的系统安全提供更完整的解决措施。