轴承故障诊断方法、系统、设备及存储介质.pdf

上传人:龙脉 文档编号:14332081 上传时间:2024-02-15 格式:PDF 页数:32 大小:4.25MB
收藏 版权申诉 举报 下载
轴承故障诊断方法、系统、设备及存储介质.pdf_第1页
第1页 / 共32页
轴承故障诊断方法、系统、设备及存储介质.pdf_第2页
第2页 / 共32页
轴承故障诊断方法、系统、设备及存储介质.pdf_第3页
第3页 / 共32页
文档描述:

《轴承故障诊断方法、系统、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《轴承故障诊断方法、系统、设备及存储介质.pdf(32页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202310493855.1(22)申请日 2023.04.26(71)申请人 山东师范大学地址 250014 山东省济南市历下区文化东路88号(72)发明人 王吉华田真真(74)专利代理机构 济南圣达知识产权代理有限公司 37221专利代理师 黄海丽(51)Int.Cl.G06F 18/241(2023.01)G06F 18/214(2023.01)G06F 18/213(2023.01)G06N 3/0464(2023.01)G06N 3/08(2023.01)G06N 3/0455(2023。

2、.01)(54)发明名称轴承故障诊断方法、系统、设备及存储介质(57)摘要本发明公开了轴承故障诊断方法、系统、设备及存储介质,所述方法,包括:获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型;基于测试集,对训练后的第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高的深度学习模型,作为最终深度学习模型输出;获取待诊断轴承的振动信号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图。

3、像输入到最终深度学习模型中,输出轴承故障诊断结果。权利要求书2页 说明书11页 附图18页CN 116610993 A2023.08.18CN 116610993 A1.轴承故障诊断方法,其特征是,包括:获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型;基于测试集,对训练后的第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高的深度学习模型,作为最终深度学习模型输出;获取待诊断轴承的振动信。

4、号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图像输入到最终深度学习模型中,输出轴承故障诊断结果。2.如权利要求1所述的轴承故障诊断方法,其特征是,所述二维图像是对轴承振动信号进行转换得到的,包括:对轴承振动信号,通过格拉姆角场算法进行转换,得到轴承振动信号的二维图像;对轴承振动信号,通过小波变换算法进行转换,得到轴承振动信号的二维图像。3.如权利要求2所述的轴承故障诊断方法,其特征是,所述对轴承振动信号,通过格拉姆角场算法进行转换,得到轴承振动信号的二维图像,具体包括:S101a1:对原始的轴承振动信号Xx1,x2,.,xn进行归一化处理,使用(1)式将X缩放至0,1范围内;其。

5、中,xi是X中的第i个值,是xi缩放后的值;S101a2:缩放后的时间戳和幅值转化为极坐标中的半径r和角余弦形成新的时间序列公式如下:其中,ti为时间戳,N是极坐标下的正则化常数因子;S101a3:通过三角函数计算任意两个数据点之间的相关性;式(3)将时间序列转化为图像:其中,I为单位行向量,为 的转置向量。4.如权利要求2所述的轴承故障诊断方法,其特征是,所述对轴承振动信号,通过小波变换算法进行转换,得到轴承振动信号的二维图像,具体包括:权利要求书1/2 页2CN 116610993 A2其中,a为尺度因子;为平移因子;a,(t)为小波基函数。5.如权利要求1所述的轴承故障诊断方法,其特征是。

6、,基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型,其中,第一深度学习模型,包括:依次连接的Resnet34网络的Conv1层、Resnet34网络的Conv2_x、Resnet34网络的Conv3_x层、Resnet34网络的Conv4_x层、Resnet34网络的Conv5_x层、可解释层、平均池化层和全连接层。6.如权利要求5所述的轴承故障诊断方法,其特征是,所述解释层,是指梯度加权类激活映射GradCAM;类判别定位图GradCAM Lc计算如下:其中,Ak是指CNN层的第k个特征图;是通过将c类分数的梯度与特征映射A的。

7、Y相结合得到的;是通过将c类分数的梯度与特征图Ak的yc进行全局平均池化得到的;f()是ReLU激活函数,用于强调对感兴趣的类别有积极影响的特征。7.如权利要求1所述的轴承故障诊断方法,其特征是,基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型,其中,第二深度学习模型,是Swin Transformer网络。8.轴承故障诊断系统,其特征是,包括:获取模块,其被配置为:获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;训练模块,其被配置为:基于训练集分别对。

8、第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型;基于测试集,对训练后的第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高的深度学习模型,作为最终深度学习模型输出;诊断模块,其被配置为:获取待诊断轴承的振动信号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图像输入到最终深度学习模型中,输出轴承故障诊断结果。9.一种电子设备,其特征是,包括:存储器,用于非暂时性存储计算机可读指令;以及处理器,用于运行所述计算机可读指令,其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求17任一项所述的方法。10.一种存储介。

9、质,其特征是,非暂时性地存储计算机可读指令,其中,当非暂时性计算机可读指令由计算机执行时,执行权利要求17任一项所述方法的指令。权利要求书2/2 页3CN 116610993 A3轴承故障诊断方法、系统、设备及存储介质技术领域0001本发明涉及机械故障诊断和可解释性领域,特别是涉及轴承故障诊断方法、系统、设备及存储介质。背景技术0002本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。0003近年来,旋转机械在现代工业中得到了广泛应用,包括汽车、电机、航空等工业领域。但是,由于恶劣的工作环境,旋转机械容易发生故障,据统计,约有4050的旋转机械故障来源于滚动轴承损伤。滚动轴。

10、承故障可能造成巨大的经济损失,严重时甚至危及操作员的安全。因此,准确且及时的诊断轴承故障,对于提高旋转机械的可靠性和运行安全性具有重要意义。0004故障诊断方法通常包括基于模型的方法和基于数据驱动的方法。前者需要大量的先验知识,在复杂条件下难以准确地建立诊断模型。后者使用传感器采集的数据进行故障诊断,它不依赖先验知识,通过分析机械信号提供准确的故障诊断结果。因此,随着智能算法的发展,数据驱动的方法在故障诊断中得到了广泛应用。目前最常见的智能故障诊断方法是在机器学习(ML)方法上开发的,如支持向量机(SVM)、K近邻(KNN)算法、自组织映射(SOM)网络等。大多数滚动轴承智能故障诊断方法都建立。

11、在振动信号的处理和分析上,ML的使用需要从获取的原始信号中人工提取特征,没有充分利用智能算法的优势。近年来,深度学习(DL)作为ML的一个重要分支,发展迅速,凭借其强大的数据处理能力和学习能力,在自然语言处理(NLP)、计算机视觉(CV)等许多领域取得了巨大成就。DL模型在轴承故障诊断领域中也得到了广泛应用,如深度置信网络(DBN)、卷积神经网络(CNN)、自动编码器(AE)、循环神经网络(RNN)、生成对抗网络(GAN)等。0005近年来,针对轴承故障类型识别困难的问题,卷积神经网络(CNN)作为DL框架中最有效的算法之一,在多个检测和识别问题上取得了显著的成果,它根据学习目标自动提取相关特。

12、征,并且不依赖专家经验,在轴承故障诊断领域得到了越来越广泛的使用。虽然随着智能算法的不断创新,轴承故障诊断在技术方面有了很大的进展,但是仍然有一些问题需要进一步研究。例如,大多数基于CNN的故障诊断方法,仅仅对故障类型进行分类,没有考虑到分类的可解释性。CNN的可解释性技术在计算机视觉领域广泛应用,但是在机械故障诊断领域的相关研究很少。因此,本发明需要使用可视化方法解释深度故障特征,建立神经网络的重点激活区域和目标类别之间的联系,解决神经网络黑盒操作的问题。其次,最近一种新的DL模型Transformer被提出,它只包含多头自注意(MSA)机制和基本的全连接层,该模型在NLP领域获得了出色的结。

13、果。Transformer模型存在自注意力机制,能有效获得全局信息,并且多头注意力机制可以将信息映射到多个空间,使模型表达能力更强,并且它突破了循环神经网络(RNN)模型不能并行计算的限制。同时,Transformer的改进模型在CV领域广泛运用,2021年Dosovitskiy等人提出了一种Vision Transformer模型用于图像分类任务,在较大数据集上取得了惊人的效果。Liu等人提出了一种Swin Transformer模型应用于图像说明书1/11 页4CN 116610993 A4分类、目标检测、语义分割等任务,相对于Vision Transformer,它更适用于下游任务。但是。

14、,尽管Transformer模型在CV和NLP领域都取得了出色的效果,但它在故障诊断领域尚未得到广泛应用。0006中国发明专利(申请号:202211138667.9,专利名称:一种滚动轴承故障诊断方法),该发明首先将获取的轴承振动信号进行时频转换以得到时频信号,然后将时频信号输入到构建的故障诊断模型中进行特征提取和识别故障。该发明的故障诊断模型可以在样本较少的情况下达到很好的学习效果,并且在一些复杂工况下性能优于其他模型,但是该发明仅仅对故障进行分类,没有考虑到神经网络的可解释。0007中国发明专利(申请号:202010662863.0,专利名称:一种基于深度学习的机械装备故障诊断方法),该发。

15、明首先对机械设备进行数据采集并进行预处理,然后通过交叉验证的方法划分数据集(分为训练集、验证集和测试集)。最后,建立基于CNN和双向长短期记忆网络(BDLSTM)的故障诊断模型,将数据集输入到故障诊断模型中提取隐藏特征并识别故障类型。该发明解决了环境干扰引起的不确定性问题,但是RNN的变体BDLSTM并没有完全解决长期依赖问题,并且RNN固有的顺序属性阻碍了训练样本间的并行化。发明内容0008为了解决现有技术的不足,本发明提供了轴承故障诊断方法、系统、设备及存储介质;通过CNN实现轴承的故障诊断,并将CNN的可解释性技术运用到故障诊断领域,通过可视化了解故障诊断结果的归因。其次,将最新的以注意。

16、力机制为核心的Transformer模型运用到轴承故障诊断领域,从而更加精确的识别故障类型。及时且准确的诊断故障能极大地降低设备的故障率及停机时间、提高设备利用率,从而为企业带来更大的经济效益,同时消除因突发故障所带来的难以估算的安全隐患。0009第一方面,本发明提供了轴承故障诊断方法;0010轴承故障诊断方法,包括:0011获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;0012基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型;基于测试集,对训练后的。

17、第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高的深度学习模型,作为最终深度学习模型输出;0013获取待诊断轴承的振动信号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图像输入到最终深度学习模型中,输出轴承故障诊断结果。0014第二方面,本发明提供了轴承故障诊断系统;0015轴承故障诊断系统,包括:0016获取模块,其被配置为:获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;0017训练模块,其被配置为:基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学。

18、习模型和训练后的第二深度学习模型;基于测试集,对训练后的第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高说明书2/11 页5CN 116610993 A5的深度学习模型,作为最终深度学习模型输出;0018诊断模块,其被配置为:获取待诊断轴承的振动信号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图像输入到最终深度学习模型中,输出轴承故障诊断结果。0019第三方面,本发明还提供了一种电子设备,包括:0020存储器,用于非暂时性存储计算机可读指令;以及0021处理器,用于运行所述计算机可读指令,0022其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述。

19、的方法。0023第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。0024第五方面,本发明还提供了一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法。0025与现有技术相比,本发明的有益效果是:0026本发明首先获取轴承的振动信号,对信号进行滑窗采样,得到更多的样本以训练更精确的模型;然后将滑窗采样后的振动信号通过格拉姆角场(GAF)和小波变换(WT)方法转换为不同类型的二维图像;将二维图像随机划分为训练集和测试集;构建卷积神经网络(CNN)。

20、和Transformer模型,训练集输入到模型中进行特征提取,测试集用于验证模型的性能;通过迁移学习的方式进行实验,验证构建模型的性能,并与其他方法进行对比;使用CNN模型的可解释性技术梯度加权类激活映射GradCAM进行可视化,解释故障诊断结果的归因。本发明的方法有更高的故障诊断准确率,优于很多现有的深度学习模型。附图说明0027构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。0028图1是本发明的方法流程图;0029图2(a)图2(j)是GAF图像;0030图3(a)图3(j)是WT图像;0031图4是基于。

21、CNN的轴承故障诊断过程图;0032图5是基于Transformer的轴承故障诊断过程图;0033图6(a)和图6(b)是基于CNN的轴承故障诊断结果;0034图7(a)和图7(b)是基于CNN的轴承故障诊断结果的混淆矩阵;0035图8(a)和图8(b)是基于Transformer的轴承故障诊断结果;0036图9(a)和图9(b)是基于Transformer的轴承故障诊断结果的混淆矩阵;0037图10(a)图10(d)是GAF图像可视化结果图;0038图11(a)图11(d)是WT图像可视化结果图;0039图12是滑窗采样的过程图。具体实施方式0040应该指出,以下详细说明都是示例性的,旨在对。

22、本发明提供进一步的说明。除非另说明书3/11 页6CN 116610993 A6有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。0041需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有。

23、的其它步骤或单元。0042在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。0043实施例一0044本实施例提供了轴承故障诊断方法;0045如图1所示,轴承故障诊断方法,包括:0046S101:获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;0047S102:基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型;0048基于测试集,对训练后的第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高的深度学习模型,作为最终深度学习模。

24、型输出;0049S103:获取待诊断轴承的振动信号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图像输入到最终深度学习模型中,输出轴承故障诊断结果。0050进一步地,S101:获取数据集,选用西储凯斯大学(CWRU)轴承数据集,从轴承上采集到的原始振动信号中每个故障状态都包含不同数量的时间过程测量值;通过滑窗采样的方式重塑样本,以确保每个样本具有一致的时间过程测量值,实现增加样本数量以训练更精确的模型的目的。0051选用了西储凯斯大学CWRU轴承数据集。该数据集轴承上的故障点均由人工加工而成,其直径分为5种:7mils,14mils,21mils,28mils和40mils(1mi。

25、l0.001inches)。SKF轴承用于直径为7、14和21mils的故障,NTN等效轴承用于直径为28mils和40mils的故障。轴承振动信号是使用加速计收集的,加速计用磁性底座固定在壳体上。本发明选用12kHz采样频率下的SKF轴承驱动端数据集和正常数据集进行实验,研究了1负载情况下的10种不同故障类型。本发明采用滑窗采样的方式进行数据增强,每1200个数据点作为一个样本,滑动窗口的尺寸设置为600,从而获得更多的样本数量用于训练更精确的模型。滑窗采样的过程如图12所示。数据集描述的详细信息列于表1。0052表1:数据集的详细信息说明书4/11 页7CN 116610993 A7005。

26、30054从轴承上采集到的原始振动信号中不同的故障状态包含不同数量的时间过程测量值。为了增加样本数量以训练更精确的模型,本发明通过滑窗采样的方式重塑样本,每1200个数据点作为一个样本,滑动窗口尺寸设置为600。滑窗采样的过程如图12所示。0055进一步地,所述二维图像是对轴承振动信号进行转换得到的,包括:0056对轴承振动信号,通过格拉姆角场算法进行转换,得到轴承振动信号的二维图像;对轴承振动信号,通过小波变换算法进行转换,得到轴承振动信号的二维图像。0057使用格拉姆角场(Gramian angular field,GAF)和小波变换(Wavelet transform,WT)方法,将重塑。

27、后的样本转换为不同类型的二维图像。0058示例性地,所述对轴承振动信号,通过格拉姆角场算法进行转换,得到轴承振动信号的二维图像,具体包括:0059S101a1:对原始的轴承振动信号Xx1,x2,.,xn进行归一化处理,使用(1)式将X缩放至0,1范围内。00600061其中,xi是X中的第i个值,是xi缩放后的值。0062S101a2:缩放后的时间戳和幅值转化为极坐标中的半径r和角余弦形成新的时间序列公式如下:00630064其中,ti为时间戳,N是极坐标下的正则化常数因子。0065S101a3:通过三角函数计算任意两个数据点之间的相关性。式(3)可以将时间序说明书5/11 页8CN 1166。

28、10993 A8列转化为图像,即GAF。00660067其中,I为单位行向量,为的转置向量。GAF图像如图2(a)图2(j)所示。0068示例性地,所述对轴承振动信号,通过小波变换算法进行转换,得到轴承振动信号的二维图像,具体包括:006900700071其中,a为尺度因子;为平移因子;a,(t)为小波基函数。WT图像如图3(a)图3(j)所示。0072小波变换(Wavelet transform,WT)是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的时间频率窗口,是进行信号时频分析和处理的理想工具。它能自动适应。

29、时频信号分析的要求,从而可聚焦到信号的任意细节,解决了Fourier变换的困难问题。0073使用GAF和WT方法将原始振动信号转换为不同类型的二维图像。GAF图完整的描述了信号的瞬时特征,如图2(a)图2(j)所示。WT图描述了信号的整体效果,如图3(a)图3(j)所示。0074进一步地,所述数据集分为训练集和测试集,是对二维图像按8:2的比例随机划分为训练集和测试集,训练集用于训练构建的深度学习模型,测试集用于验证模型的性能。0075本发明将重构后的2000个样本以8:2的比例随机划分为训练集和测试集,即1600个训练样本和400个测试样本。本发明通过使用训练集训练神经网络模型,测试集用于评。

30、估模型的性能。0076进一步地,S102:基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型,其中,第一深度学习模型,包括:依次连接的Resnet34网络的Conv1层、Resnet34网络的Conv2_x、Resnet34网络的Conv3_x层、Resnet34网络的Conv4_x层、Resnet34网络的Conv5_x层、可解释层、平均池化层和全连接层。0077本发明选择Resnet34网络用于故障分类任务,有以下几个原因。首先,Resnet34网络中包含残差结构,它能简化网络的训练,减少网络的训练参数。其次,Resnet34。

31、网络使用了Batch Normalization层,它能够解决梯度消失或者梯度爆炸问题。第三,大多数工业监测数据都具有局部相关性,因为CNN滤波器可以学习局部相关信息,因此适合于工业故障检测。最后,工业环境经常受到噪音的污染,CNN可以提取平移不变特征,增强鲁棒性,减少噪说明书6/11 页9CN 116610993 A9声的不利影响。构建的Resnet模型如图4所示。0078将2D图像输入到CNN中的Resnet34网络模型中,该网络的第一层卷积操作使用了64个尺寸大小为(7,7)的卷积核,移动步长为2。每一个卷积操作后,都要依次经过批量归一化层和激活层。其余的卷积层操作和第一层类似。每个弯曲。

32、箭头代表一个残差结构,旁边的数字代表由几个一样的残差结构相连。图4中的Conv3_x、Conv4_x、Conv5_x所对应的第一层残差结构都是虚线残差结构,该残差结构需要将特征矩阵的高和宽缩减为原来的一半,并且调整通道数。经过一系列卷积操作后,再依次通过平均池化层、全连接层和Softmax函数,识别故障的类型和位置。本发明是在CWRU轴承数据集上进行的实验,轴承的故障类别可以分为四大类:内圈故障(IR)、外圈故障(OR)、滚动体故障(BR)和正常(Normal)。CNN的整个故障诊断过程如图4所示。0079基于CNN的故障诊断方法的详细步骤总结在以下算法中:0080输入:GAF或WT图像008。

33、1步骤一:特征提取。0082特征提取器可以从原始数据中提取特征,以下是特征提取核心层的操作:0083卷积层:0084批归一化层:0085ReLU激活层:RrReLU(Hr)max(Hr,0)0086最大池化层:0087步骤二:故障分类。0088故障分类器根据提取到的特征识别故障类型,以下是故障分类核心层的操作:0089平均池化层:0090全连接层:ZZ1,Z2,.,Zr,.,ZR,GReLU(WgZ+bg)0091Softmax函数:0092输出:目标类别(Normal,BR007,.,OR021)。0093在上面的算法中,q1,2,3,.,Q,Q是预定义的滤波器的数量;p1,2,3,.,P,。

34、P是通道数量;Wp,q和bq分别表示滤波器的权重和偏差;c是特征C的小批量;u和 2分别是小批量的均值和方差;是接近0的最小值;S表示池化函数的范围;Wg和bg表示全连接层的权重和偏差;Oj表示类别j的估计概率;(j)是Softmax函数的参数;K是目标类别的数量。0094进一步地,所述解释层,是指梯度加权类激活映射GradCAM;0095类判别定位图GradCAM Lc计算如下:00960097其中,Ak是指CNN层的第k个特征图;是通过将c类分数的梯度与特征映射A的Y相结合得到的。是通过将c类分数的梯度与特征图Ak的yc进行全局平均池化得到的;f()是ReLU激活函数,为了强调对感兴趣的类。

35、别有积极影响的特征。0098为了更好地理解CNN,对其在视觉上进行可视化解释,更好地对模型进行决策,提说明书7/11 页10CN 116610993 A10出了梯度加权类激活映射(Gradientweighted Class Activation Mapping,GradCAM),相比于之前的工作CAM,GradCAM可以对任意结构的CNN进行可视化,不需要修改网络结构或者重新训练。所以,为了解释故障分类结果,本发明在Resnet34网络的最后一个卷积层上使用GradCAM来定位和突出区分区域。CNN的可解释技术在故障诊断领域的应用很少,为了弥补这一空白,本发明将其应用到故障诊断中。可视化结果。

36、如图10(a)图10(d)和图11(a)图11(d)所示。0099应理解地,为了解释故障诊断结果,使用了梯度加权类激活映射(Gradientweighted Class Activation Mapping,GradCAM)。GradCAM是一种类判别定位方法,它使用基于反向传播的滤波器梯度和卷积激活值为每个类别分配分数,提供了一种查看图像中哪些特定部分影响模型决策的方法。0100为了解释故障分类结果,本发明在CNN的最后一个卷积层上使用GradCAM来定位和突出区分区域。从四大类轴承故障样本中各选择一个GAF图像进行可视化,可视化结果如图10(a)图10(d)所示。0101实验结果表明:正常。

37、轴承振动信号较弱,没有明显的冲击峰值,网络模型的关注区域分散在输入信号的大部分片段上,这表明大部分信号序列对于输出的贡献程度基本相同;对于外圈、内圈和滚动体故障的轴承,网络激活程度较大的部分基本集中在振动信号较强的部分,该部分的信息对于网络的分类结果具有较高的权重,说明该位置含有较多的故障特征信息。从四大类轴承故障WT图像中各选择一个样本进行可视化,可视化结果如图11(a)图11(d)所示。实验结果表明,网络关注的重点区域是振幅较大的部分。因此,卷积神经网络在轴承故障诊断领域中对于样本的分类识别与人的认知规律存在基本的相似性,可以证明本发明提出的方法在进行故障分类时关注的区域是正确的,解决了神。

38、经网络黑盒操作的问题。0102进一步地,S102:基于训练集分别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型,其中,第二深度学习模型,是Swin Transformer网络。0103以注意机制为核心的Transformer模型在自然语言处理领域成功运用,几乎替代了RNN。此外,Transformer的改进模型Vision Transformer和Swin Transformer在计算机视觉领域成功运用,并取得了前所未有的效果。但是最新的Transformer模型尚未在故障诊断领域得到应用,Swin Transformer模型比Vision。

39、 Transformer模型更适用于下游任务。Swin Transformer模型在计算机视觉领域表现出了优异的性能,例如图像分类、语义分割、目标检测等。因此,本发明提出了一种基于二维图像和Swin Transformer模型相结合的方法,用于轴承故障诊断。0104Swin Transformer具有类似于CNN的分层结构,基于故障诊断的Swin Transformer整体架构如图5所示。Swin Transformer Block模块是Swin Transformer模型的核心,它由一个基于窗口的多头注意力机制(Window based Multihead SelfAttention,WMS。

40、A)模块和一个基于移动窗口的多头注意力机制(Shifted Window based Multihead SelfAttention,SWMSA)模块构成。层归一化(LayerNorm,LN)被应用于每个多头注意力机制(Multihead SelfAttention,MSA)模块和每个多层感知器(Multilayer perceptron,MLP)前,且一个残差连接被应用于每个模块后。说明书8/11 页11CN 116610993 A110105两个连续Swin Transformer Blocks的计算可表示为:01060107010801090110其中,和xl表示block l中WMSA。

41、模块和MLP模块的输出特征。0111具有相对位置偏差的自我关注计算如下:01120113其中,是query,key和value矩阵;d是query/key的维度;M2是窗口中patches的数量。0114基于移动窗口的Swin Transformer模型的整体网络架构采取层次化的设计,共包含4个Stage,每个Stage都会缩小输入特征图的分辨率,类似于CNN操作。一张输入尺寸大小为2242243的图像,首先会像Vision Transformer一样,把图片分成patch块,这里Swin transformer中使用的patch size大小为44,不同于Vision Transformer。

42、中使用的大小为1616。经过Patch Partition,图像的大小会变成565648。Linear Embedding层的主要作用是为了把向量的维度变成本发明预先设定好的值,即满足Transformer可以输入的值。本发明使用的Swin Transformer模型中通道数C的大小为96,经过Stage1后得到的网络输出值为56x56x96。在Stage2中,类似卷积神经网络的池化操作,Patch Merging用于缩小分辨率和调整通道数,从而实现模型的层级式设计。这里每次的下采样为2,在行和列方向每隔一个点选取元素,之后拼接在一起展开,将通道数的大小变成2C,经过Stage2操作之后网络输。

43、出的大小变为2828192。Stage3、Stage4同理,最终的网络输出的大小变为77768,经过展平,序列长度变成49768。然后依次通过Avgpool层、Flatten层、Linear层和Softmax层,通过Softmax层获得输入图像属于每个类别的概率值,从而获得样本的故障类型。基于Swin Transformer的故障诊断任务的流程如图5所示。0115进一步地,所述S102之后,所述S103之前,还包括:使用迁移学习的方法进行实验,数据集较小时也能快速的训练出理想的模型。同时,将本发明模型的性能与其他优秀的模型进行对比。0116本发明使用迁移学习的方法进行实验,数据集较小时也能快速。

44、的训练出理想的模型。本发明根据不同的分类和预测目标,在预训练Resnet34网络的基础上进行参数调整。通过Resize方法将时序图像的尺寸大小重构为(224,224),经过多次堆叠的卷积层、池化层、批量归一化层操作后,输出特征图的尺寸大小从(224,224)变为(7,7,512)。然后输出特征图通过平均池化层、全连接层和Softmax函数,从而识别时序图像的类别。在训练过程中,Adam优化算法的学习率设置为0.0001,训练迭代次数设置为50次。基于CNN的轴承故障诊断结果如图6(a)和图6(b)所示。0117基于CNN的轴承故障诊断结果如图6(a)和图6(b)所示,图6(a)是关于GAF图像。

45、的,图6(b)是关于WT图像的。实验结果表明,本发明的方法在测试集GAF图像和WT图像上故障诊说明书9/11 页12CN 116610993 A12断准确率分别达到了96和100。GAF图像包含的特征较复杂,WT图像提取的特征更加直观,所以神经网络在WT图像上有更高的准确率。为了更加清晰地了解故障分类的细节,本发明绘制了混淆矩阵如图7(a)和图7(b)所示,图7(a)是关于GAF图像的混淆矩阵,图7(b)是关于WT图像的混淆矩阵。横轴表示真实标签,纵轴表示预测标签。对于GAF图像,BR007和BR021类有相对多一点的样本分类错误,但是这两类样本属于同一大类,因此神经网络在分类时有一定的困难。。

46、IR021和OR01461错误分类的样本分别有2个和1个。对于WT图像,所有的样本都分类到了正确的类别。0118本发明调整Swin Transformer中的参数,使模型适合本发明的故障诊断任务。输入图像的尺寸设置为224224,类别数为10,Adam优化算法的学习率设置为0.0001,迭代次数为50。本发明在预训练好的Swin Transformer模型上进行迁移学习,训练集较小时也能训练出理想的模型。在训练过程中,除了head层外,其他层的参数全部冻结。基于Swin Transformer的故障诊断结果如图8(a)和图8(b)所示。0119基于Swin Transformer的轴承故障分类。

47、的实验结果如图8(a)和图8(b)所示,图8(a)是关于GAF图像的,图8(b)是关于WT图像的。实验结果表明,本发明的方法在测试集GAF和WT图像上故障诊断准确率分别达到了98.5,100。CWRU数据集重构后仅仅包含2000个样本,本发明的模型在小样本上取得了很好的性能。为了更加清晰地了解故障分类的细节,本发明绘制了混淆矩阵如图9(a)和图9(b)所示,图9(a)是关于GAF图像的混淆矩阵,图9(b)是关于WT图像的混淆矩阵。横轴表示真实标签,纵轴表示预测标签。对于GAF图像,只有少数的BR021类的样本分类错误,其余的图像都正确分类到了相应的类别。对于WT图像,所有的样本都分类到了正确的。

48、类别。0120实验结果表明,本发明的方法在不依赖于任何先验知识的情况下,轴承振动信号以及标签足以准确分类轴承故障类型。因为Swin Transformer模型中的多头注意力机制能够有效获得全局信息,所以Swin Transformer模型相对于CNN模型在GAF图像上有更高的准确率,为了进一步说明本发明方法的有效性,与使用同一数据集的其他方法进行比较,比较结果如表2。为了避免实验结果的偶然性,本发明进行了5次实验,表2中的实验结果是5次实验结果的平均值。由表2可以看出,本发明的方法超过了很多优秀的深度学习模型。0121表2:本发明的方法与其他深度学习模型的比较。0122方法类别数准确率LSSV。

49、M489.50BPNN1081.35LFGRU1097.32ConvRNN1094.74ANN2922DViT1094CNN(GAF)1096CNN(WT)10100Transformer(GAF)1098.5Transformer(WT)101000123实施例二说明书10/11 页13CN 116610993 A130124本实施例提供了轴承故障诊断模型训练系统;0125轴承故障诊断系统,包括:0126获取模块,其被配置为:获取数据集,所述数据集为已知轴承故障类型标签的二维图像,二维图像是对轴承振动信号进行转换得到的;所述数据集分为训练集和测试集;0127训练模块,其被配置为:基于训练集分。

50、别对第一深度学习模型和第二深度学习模型进行训练,得到训练后的第一深度学习模型和训练后的第二深度学习模型;基于测试集,对训练后的第一深度学习模型和训练后的第二深度学习模型进行测试,筛选出分类精度高的深度学习模型,作为最终深度学习模型输出;0128诊断模块,其被配置为:获取待诊断轴承的振动信号,将待诊断轴承的振动信号转换为二维图像,将待诊断轴承的二维图像输入到最终深度学习模型中,输出轴承故障诊断结果。0129此处需要说明的是,上述获取模块、训练模块和诊断模块对应于实施例一中的步骤S101至S103,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述。

展开阅读全文
内容关键字: 轴承 故障诊断 方法 系统 设备 存储 介质
关于本文
本文标题:轴承故障诊断方法、系统、设备及存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14332081.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开