中文题目:基于Transformer增强原型网络的潜油电泵小样本故障诊断
论文题目:Few-shot Fault Diagnosis for Electric Submersible Pump Based on Transformer-enhanced Prototypical Network
录用会议:CPCC2025 (CAA A类会议)
作者列表:
1)王亮程 中国天天色天天(北京)人工智能学院 本科生
2)李 康 中国天天色天天(北京)人工智能学院 自动化系教师
3)高小永 中国天天色天天(北京)人工智能学院 自动化系教师
摘要:
潜油电泵是油田重要的提升工具,实时故障诊断是保障经济效益的重要措施。然而,目前电潜泵故障诊断面临样本稀缺、动态数据特征提取困难等问题。近年来,元学习逐渐成为解决小样本故障诊断问题的潜在方案。为此,我们在现有研究成果的基础上,融合原型网络和Transformer的优势,开发了一套电潜泵故障诊断程序。
背景与动机:
在海洋及陆上油田,潜油电泵凭(ESP)借大排量、高扬程的优势已成为人工举升的主力设备,然而其长期运行于高温、高压、含砂、含硫的极端环境,故障机理复杂且突发性强;一旦发生故障,轻则减产停机,重则引发井口泄漏、火灾爆炸等重大事故。现场运维对实时、精准的故障诊断提出了极高要求,但出于安全规范,ESP不允许在故障状态下长时间运行,导致可采集的故障样本数量极少,且信号呈现多变量、非线性、强时序耦合的特点,传统依赖大量标注数据的深度学习方法难以直接适用。此外,海上平台作业空间受限、检修成本高,更加剧了对“小样本、高可靠”诊断技术的迫切需求。因此,本文着眼于元学习范式,提出融合Transformer长程依赖建模与原型网络度量学习的TEPN框架,以实现极少量故障样本下的快速、准确诊断,从而保障油田安全高效生产。
设计与实现:
本文针对电潜泵故障样本稀缺的难题,设计并实现了一套 Transformer-增强原型网络(TEPN):首先提出多变量时间序列分词策略(MTST),将原始高维、非线性的 ESP 信号切分成可嵌入的“时序补丁”,并引入可学习的类令牌与位置编码,适配 Transformer 的输入格式;随后堆叠多层 Transformer 编码器,利用多头自注意力捕获跨变量的长程依赖,输出鲁棒的故障特征;最后在元学习框架下,外循环通过大量随机采样的 N-way K-shot 任务,用负对数似然损失端到端优化 Transformer 与嵌入参数,内循环仅用少量支持样本计算每类原型向量,并以欧氏距离的方式完成查询样本的零梯度分类。整个系统在真实油田 10 类故障数据上实现了 90% 左右的小样本诊断准确率,验证了其有效性。
实验结果及分析:
实验在中国能源发展有限公司提供的现场电潜泵故障数据集上进行,共涵盖10类常见故障。按照3-way 3-shot、3-way 5-shot、4-way 3-shot、4-way 5-shot四种典型小样本设置测试,TEPN在四个子数据集上的平均诊断准确率分别稳定在89.3%–94.9%区间,标准差普遍小于6%,显示出良好的鲁棒性。进一步通过t-SNE可视化可见,Transformer编码后的特征空间内同类故障聚类紧密、异类间边界清晰;混淆矩阵亦表明各类别召回率均衡,无严重混淆。对比实验显示,TEPN优于传统原型网络。
结论:
本文提出了一种新的ESP系统TEPN技术。该技术结合MTST策略对ESP数据进行预处理,并结合Transformer编码器,构建了一个高效的模块来学习ESP的嵌入特征,从而捕捉ESP变量的长期依赖关系。同时,该技术依赖于原型网络的稳定性来应对小样本的挑战。最后,基于中国能源开发有限公司采集的真实ESP故障数据进行了全面的对比实验,以验证所提方法的有效性。
作者简介:
李康,讲师,博士,硕士生导师,IEEE Member, 中国自动化学会会员,中国人工智能学会会员。长期从事复杂流程工业系统安全监测与故障诊断、智能制造及先进机器人感知与交互技术等相关教学与科研工作。