基于信息熵的分布式光纤数据特征重构方法.pdf

上传人:小** 文档编号:14525651 上传时间:2024-05-19 格式:PDF 页数:12 大小:865.78KB
收藏 版权申诉 举报 下载
基于信息熵的分布式光纤数据特征重构方法.pdf_第1页
第1页 / 共12页
基于信息熵的分布式光纤数据特征重构方法.pdf_第2页
第2页 / 共12页
基于信息熵的分布式光纤数据特征重构方法.pdf_第3页
第3页 / 共12页
文档描述:

《基于信息熵的分布式光纤数据特征重构方法.pdf》由会员分享,可在线阅读,更多相关《基于信息熵的分布式光纤数据特征重构方法.pdf(12页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202410003931.0(22)申请日 2024.01.03(71)申请人 浙江省白马湖实验室有限公司地址 310051 浙江省杭州市滨江区长河街道滨盛路1751号1110室 申请人 浙江大学国家管网集团浙江省天然气管网有限公司(72)发明人 李清毅滕卫明朱程远李江杨秦敏张国民何国军江芸(74)专利代理机构 杭州杭诚专利事务所有限公司 33109专利代理师 丁昱(51)Int.Cl.G06F 18/213(2023.01)G06F 18/2135(2023.01)G06F 18/15(2023。

2、.01)G06F 17/16(2006.01)(54)发明名称一种基于信息熵的分布式光纤数据特征重构方法(57)摘要本发明公开了一种基于信息熵的分布式光纤数据特征重构方法。为了克服现有技术实际分布式光纤的应用场景中存在不同的外部干扰,干扰振动检测的问题;本发明包括以下步骤:S1:多分布式光纤数据进行多维特征提取,并计算每个特征的信息熵;S2:根据信息熵的阈值比较筛选特征,筛选后的特征构成特征矩阵;S3:对特征矩阵中的数据去均值化处理后,采用主要成分分析对特征矩阵降维,获得重构特征。通过对特征进行降维处理,在保障时效性的同时,减少特征冗余,提升后续检测、识别、定位等任务的运行效率;采用数据均值化。

3、代替数据标准化消除数据在量纲和数量级上的差异,避免了各特征间的变异程度差异性被淹没。权利要求书2页 说明书7页 附图2页CN 117520824 A2024.02.06CN 117520824 A1.一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,包括以下步骤:S1:多分布式光纤数据进行多维特征提取,并计算每个特征的信息熵;S2:根据信息熵的阈值比较筛选特征,筛选后的特征构成特征矩阵;S3:对特征矩阵中的数据去均值化处理后,采用主要成分分析对特征矩阵降维,获得重构特征。2.根据权利要求1所述的一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,对于存在n种取值的特征X,对应的信息熵。

4、定义为:;其中,表示特征X取值为时的概率值;表示的是特征X的信息熵。3.根据权利要求1或2所述的一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,将计算得到的各特征的信息熵与信息熵阈值比较,保留大于信息熵阈值的特征;将保留的特征构成新的特征矩阵X。4.根据权利要求3所述的一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,对特征矩阵X 的去均值化处理过程为:;其中,为特征矩阵中去均值化后的第i行第j列的特征数据;为特征矩阵中去均值化后的第i行第j列的特征数据;m为特征维度个数。5.根据权利要求1或4所述的一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,对特征矩阵的降维过程包括。

5、:计算去均值化数据的协方差矩阵C,并采用特征值分解计算协方差矩阵C的特征值和特征向量;选取若干特征值与对应的特征向量相乘,实现特征降维。6.根据权利要求5所述的一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,协方差矩阵C的计算方法如下:;其中,代表特征矩阵的转置;权利要求书1/2 页2CN 117520824 A2m代表维度个数;表示每个数据的协方差。7.根据权利要求5所述的一种基于信息熵的分布式光纤数据特征重构方法,其特征在于,根据下式计算处理的保留贡献率:;其中,为第i个特征值;k为选取的特征值数量;d为全部特征值数量。权利要求书2/2 页3CN 117520824 A3一种基于信。

6、息熵的分布式光纤数据特征重构方法技术领域0001本发明涉及光纤数据重构技术领域,尤其涉及一种基于信息熵的分布式光纤数据特征重构方法。背景技术0002外部入侵事件已经成为长输天然气管道破坏的主要原因,管道破坏会带来气体泄漏、燃爆、地表塌陷等事故,造成的生命、财产损失是十分巨大而沉重的。如何高效、及时、精准地早期定位外部入侵事件,从而进行提前干预是目前管道防范外部破坏的迫切需求,具有重大的社会价值与研究意义。0003分布式光纤传感具有长距离铺设、可塑性强、供电简单、抗电磁干扰、耐腐蚀等先天优势,可以十分便利地在山地、农林、河流等各类复杂地形下铺设应用,对各类长距离、大范围设施的入侵事件检测任务具有。

7、很好的适应性,在防范管道外部入侵方面具有巨大的研究价值与应用前景。例如,一种在中国专利文献上公开的“分布式光纤地质沉降与管道应力危害预警监测装置和方法”,其公告号:CN109099948A,将全分布式光纤应变检测系统与准分布式光纤应变检测系统相结合,对布里渊散射信号和光纤光栅回波信号进行实时处理和解调,将应变信息和具体位置在显示装置上显示出来。0004分布式光纤传感系统应用于管道外部威胁监测时,相比于实验室环境下还面临着一系列的实际问题。0005一方面光波能量存在着随距离衰减的物理规律,同时天然气管道沿线存在着山地、农田、公路等不同的地质地貌,不同的地质对于振动的传导是有所差异的。0006另一。

8、方面,天然气管道沿线还存在高速公路、铁道线路、工厂等各类存在干扰性振动的场景,这些场景引发的振动在信号特性上与挖掘机、钻土机等机械挖掘威胁事件存在着一定的相似性,给威胁事件识别带来了很大的干扰。发明内容0007本发明主要解决现有技术实际分布式光纤的应用场景中存在不同的外部干扰,干扰振动检测的问题;提供一种基于信息熵的分布式光纤数据特征重构方法,通过计算多维特征的信息熵,并对数据进行均值化处理后再进行主成分分析,获得特征降维后的重构特征,进行深入表征,提高数据处理的效率与有效性。0008本发明的上述技术问题主要是通过下述技术方案得以解决的:一种基于信息熵的分布式光纤数据特征重构方法,包括以下步骤。

9、:S1:多分布式光纤数据进行多维特征提取,并计算每个特征的信息熵;S2:根据信息熵的阈值比较筛选特征,筛选后的特征构成特征矩阵;S3:对特征矩阵中的数据去均值化处理后,采用主要成分分析对特征矩阵降维,获得重构特征。0009本方案对特征进行降维处理,在保障时效性的同时,减少特征冗余,提升后续检说明书1/7 页4CN 117520824 A4测、识别、定位等任务的运行效率;采用数据均值化代替数据标准化消除数据在量纲和数量级上的差异,避免了各特征间的变异程度差异性被淹没。0010作为优选,对于存在n种取值的特征X,对应的信息熵定义为:00110012其中,表示特征X取值为时的概率值;表示的是特征X的。

10、信息熵。0013反映的是特征X的信息量,越小对应的信息熵越大,意味着其发生时提供的信息量越大。0014作为优选,将计算得到的各特征的信息熵与信息熵阈值比较,保留大于信息熵阈值的特征;将保留的特征构成新的特征矩阵X。0015在主要成分分析(PCA)的基础之上引入了信息熵做特征筛选,提升了数据降维的效率。0016作为优选,对特征矩阵X 的去均值化处理过程为:0017其中,为特征矩阵中去均值化后的第i行第j列的特征数据;为特征矩阵中去均值化后的第i行第j列的特征数据;m为特征维度个数。0018并采用数据均值化代替原有PCA方法数据预处理采用的标准化处理,消除特征数量级和量纲的差异,同时也保留变异程度。

11、的差异性。0019作为优选,对特征矩阵的降维过程包括:计算去均值化数据的协方差矩阵C,并采用特征值分解计算协方差矩阵C的特征值和特征向量;选取若干特征值与对应的特征向量相乘,实现特征降维。0020作为优选,协方差矩阵C的计算方法如下:0021其中,代表特征矩阵的转置;m代表维度个数;说明书2/7 页5CN 117520824 A5表示每个数据的协方差。0022作为优选,根据下式计算处理的保留贡献率:0023其中,为第i个特征值;k为选取的特征值数量;d为全部特征值数量。0024特征值可以反映各特征在原始特征组的信息重要程度,可选取前k个作为预期分量,去除特征值较小的成分。0025本发明的有益效。

12、果是:1.针对特征提取冗余问题,提升分布式光纤数据的处理效率,提出了基于信息熵的特征重构方法,对特征进行降维处理,在保障时效性的同时,减少特征冗余,提升后续检测、识别、定位等任务的运行效率;2.采用数据均值化代替数据标准化消除数据在量纲和数量级上的差异,避免了各特征间的变异程度差异性被淹没。附图说明0026图1是本发明的基于信息熵的特征降维流程图。0027图2是本发明的0,1信源信息熵曲线图。0028图3是本发明的信息熵、条件熵与互信息的关系示意图。具体实施方式0029下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。0030实施例:本实施例的一种基于信息熵的分布式光纤数据特征。

13、重构方法,包括以下步骤:多分布式光纤数据进行多维特征提取,并计算每个特征的信息熵。0031对光纤传感信号进行特征提取,包括幅值特征、离散程度特征、波形分布特征,共15维特征,提取方法根据公式对原始信号进行特征计算。0032其中,峰值(Peak value,PK)和最小值(Minimum,Min)是指扰动信号的幅值最大值和最小值。0033峰峰值(PeaktoPeak,PKPK)是这两者的差值。0034均值(Mean,M)即为幅值平均。0035能量(Energy,E)是扰动信号的绝对值的平方和,一般取对数处理避免数组过大。0036整流平均值(Average rectified value,Arv)。

14、是信号绝对值的平均,因而其对差分前信号而言意义与均值一致。0037均方根(Root Mean Square,RMS)借鉴了交流电的计算方式,描述的是波形的有效值。0038方差(variance,var)和标准差(Standard deviation,SD),两者描述了信号较说明书3/7 页6CN 117520824 A6均值的离散程度方。0039峭度因子(Kurtosis,Kur)描述的是波形平缓程度。0040偏度因子(Skewness,Skew)描述的是波形分布偏斜方向和程度。0041裕度因子(Clearance factor,CL)、波形因子(Shape factor,S)、峰值因子(Cr。

15、est factor,C)、脉冲因子(Impulse factor,I)是都是比值定义,对于冲击性较为敏感。0042接着,采取基于信息熵的PCA方法进行特征降维,从而获得重构特征。0043信息熵是用于来衡量事件或信号的不确定性的,对于一个事件而言,如果其发生概率越小,那么该事件发生是提供的信息就越多。如“地球是圆的”和“太阳从西边升起”,前者为已知的既定事实,“地球是圆的”对该事件的发生并不能提供任何有效信息,其信息量为0;后者是一个不可能事件,如若发生“太阳从西边升起”,则意味着宇宙发生重大变化,对此而言它所提供的信息量是无穷大。0044对于一个具有n种取值的随机变量X,即,其信息熵的定义为。

16、:0045其中,表示随机变量X取值为时的概率值,其概率值大于等于0,且有:0046反映的是变量X的信息量;越小对应的信息熵越大,意味着其发生时提供的信息量越大。0047只有0,1两者可能元素的元信源是最简单的单符号信源,其信息熵如图2所示。0048信息熵具有如下特性:1.非负性:任一信源提供的信息量大于等于0,即。00492.单调性:如果,那么对应的。00503.累加性:两个互相独立元素对应信息熵可以通过加和计算,即。0051类似地,随机变量X和变量Y的条件熵为:0052表示在给定变量Y的条件下随机变量X的不确定性。如若变量X和变量Y两者相互独立,则有:0053随机变量X和变量Y的互信息为:说。

17、明书4/7 页7CN 117520824 A70054互信息描述的是随机变量Y在因为已知Y事件而减少的信息量,反映的是事件间的依赖性,其同时也满足。0055信息熵、,条件熵、,互信息的相互关系如图3所示。0056基于信息熵的特征降维算法具体流程如图1所示,其在主要成分分析(PCA)的基础之上引入了信息熵做特征筛选,提升了数据降维的效率;并采用数据均值化代替原有PCA方法数据预处理采用的标准化处理,消除特征数量级和量纲的差异,同时也保留变异程度的差异性。0057对于含有d个样本数、m个维度特征的信号特征组,其特征降维过程如下:1)特征信息熵筛选。0058计算各特征的信息熵,与信息熵阈值做比较。0。

18、059如果大于设定的信息熵阈值,则将特征保留,否则将其剔除。0060在本实施例中,信息熵阈值选为全体特征信息熵的中位数,即实现对50%的特征进行初步筛选。00612)获得新特征矩阵。0062对于信号特征组所有特征完成信息熵计算之后,将满足条件的特征加入新的特征矩阵中,最终得到新的特征矩阵。00633)对特征矩阵中的数据去均值化,消除量纲差异,其过程如下式所示。00640065其中,为特征矩阵中去均值化后的第i行第j列的特征数据;为特征矩阵中去均值化后的第i行第j列的特征数据;m为特征维度个数。00664)计算去均值化数据的协方差矩阵。0067协方差矩阵C的计算方法如下:0068其中,代表特征矩。

19、阵的转置;m代表维度个数;表示每个数据的协方差。00695)计算协方差矩阵的特征值和特征向量。说明书5/7 页8CN 117520824 A80070采用特征值分解进行计算,可表示为:00710072其中,是特征向量 对应的特征值;是矩阵的特征向量组成的矩阵;则是一个对角阵,对角线上的元素就是特征值。00736)选取主成分。0074计算得到的特征值可以反映各特征在原始特征组的信息重要程度,可选取前k个作为预期分量,去除特征值较小的成分。再根据下式计算本次处理所保留贡献率。007500767.获得降维后特征。0077将选取的k个特征值与对应特征向量相乘,实现从d维到k维的特征降维。0078007。

20、9选取某省天然气管网采集到的光纤监测数据进行实验验证,如表1所示。0080表1.某省天然气管网的光纤监测数据降维实验验证表0081通过基于信息熵的特征降维,将光纤传感信号特征提取得到15维幅值特征、离散程度特征和形状特征转化为4维度的主成分特征,保留99.06%的贡献率,同时也有效降低模型的训练和预测负担。0082本实施例的方案针对特征提取冗余问题,提升分布式光纤数据的处理效率,提出了基于信息熵的特征重构方法,对特征进行降维处理,在保障时效性的同时,减少特征冗余,提升后续检测、识别、定位等任务的运行效率;采用数据均值化代替数据标准化消除数据在量纲和数量级上的差异,避免了各特征间的变异程度差异性被淹没。0083应理解,实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅说明书6/7 页9CN 117520824 A9读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。说明书7/7 页10CN 117520824 A10图1说明书附图1/2 页11CN 117520824 A11图2图3说明书附图2/2 页12CN 117520824 A12。

展开阅读全文
内容关键字: 基于 信息 分布式 光纤 数据 特征 方法
关于本文
本文标题:基于信息熵的分布式光纤数据特征重构方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14525651.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开