1.背景 当前使用于进行心律失常监测的信号主要是ECG,其产品形态主要包括三个形式: - 一是基于腕带形态,通过分别用一只手的腕带外侧和另外一只手内侧的金属传感器采集单通道ECG信号的方法,如图所示:
- 二是使用holter形态的采集单(或多)通道ECG信号的方法,如图所示:
- 三是使用多导监护仪采集多通道ECG信号的方法,如图所示:
以上三类使用ECG信号进行心律失常识别的产品形态中:腕带形态由于需要两只手同时操作才能进行心律失常的识别,因此这种形态不适合用于心律失常的长期连续监测;Holter形态适合长期连续监测,但其在舒适性上面的缺陷会影响人体睡眠、运动等其它的活动,对于非临床诊断患者反而带来生活上的不便;多导监护仪形态适合进行手术前后的重度病人。因此,开发一种便于采集可用心律失常监测的信号,同时不影响佩戴者的正常生活的设备,具有重要的实际意义。 2.技术解决问题 结合腕带最近已经成为一种广泛使用的健康管理工具,每天都有大量的人佩戴,同时装有PPG传感器的腕带可以为心律失常提供一种低功耗、便捷的监测方法。因此,结合深度学习算法的腕带式可穿戴设备是检测心律失常的有效方法。然而,由于当前用PPG检测心律失常的数据量少,并且PPG不能识别心房活动(P波)导致检测的心律失常类别有限,如何获取能有效的识别心律失常PPG信号是一个值得探索的方向。 可以克服这个挑战的一个方法是迁移学习方法的能力,特别是基于监督深度学习的迁移学习模型,如卷积神经网络、递归神经网络或注意力网络模型的迁移学习模型,已经被证明可以在给定源域和目标域的基础上从源域学习到经验用于高效构建目标域的分类模型,其过程如图所示: 成功应用于ECG信号心律失常识别分类的深度学习方法,在用于PPG信号进行心律失常分类时,出现了新的挑战:为了使用PPG信号进行心律失常分类识别产生准确的结果,需要来自采集心律失常过程对应PPG信号中具有代表性和可靠的数据基础,但在稀疏数据是常见问题的心律失常PPG的信号领域却是昂贵的要求。 在标注心律失常PPG信号的背景下,这些数据是通过在真实患者身体上进行采集或通过模拟来收集或者通过ECG信号进行迁移获得的。三种可能性都有其缺点。 - 首先,真实的人体数据采集既费时又费钱,导致很难收集足够的数据来训练可靠的深度学习模型;
- 其次,模拟的本质是假设现实的简化视图,导致成本更低,并且在大多数情况下,具有更快的结果,然而,这确实偏离了真实的观察;
- 最后,相近数据集的迁移,可以减少在学习新任务所需的数据量和时间,或者模型预测分类性能的提高(与从头开始学习相比),但是这建立在两个领域的解空间相似的假设条件下。
因此,在仿真数据上训练的深度学习模型对于真实数据的性能高度依赖于仿真和现实之间的差距,在相近数据集上迁移的深度学习模型对于真实数据的性能高度依赖于源域和目标域之间的差距,即使最精确的模型也只能再现仿真与现实,源域和目标域之间的偏差。这就是要解决的一个中心问题,即如何通过监督学习模型来克服模拟和真实数据之间、源域和目标域的差距,而不需要许多昂贵的真实实验。 3.技术方案 鉴于上述内容中心律失常情况下PPG信号采集困难、以及一致性不强等问题。提供一种能够实现对PPG信号进行心律失常监测的模型,同时在模型性能不明显降低的情况用于训练的真实PPG信号数据量大大减少,旨在解决传统深度学习模型对PPG信号实现心律失常分类监测的模型所需标注的真实数据样本较大的问题,同时提升模型的泛化性能。 基于迁移学习桥接心电信号和脉搏波心律失常分类识别的方法,包含空间特征提取原理、时间特征提取原理、空时特征融合原理、数据域迁移原理和结构域迁移原理。 CNN空间特征提取原理,其中的一维卷积即试图提取信号在某一方向的平移不变特征,这里的ECG/PPG信号也是一种时间序列。因此,使用一维卷积进行提取的ECG/PPG信号在时间方向的平移不变特征,可以更充分提取了ECG/PPG信号中的特征信息并且筛选出具有区分度的信息,在提高了ECG/PPG信号在不同心律失常实时分类监测方法的准确性能同时,也保证了分类系统的泛化性能。其中构建CNN模型结果,设置两层图卷积层,同时使用ReLU作为激活函数,然后使用全连接层将CNN提取的特征线性映射后输入特征融合模块。 LSTM时间特征提取原理,LSTM作为循环神经网络的变种,具有非线性拟合能力,能够有效提取数据的时间特征,克服了RNN中容易出现梯度消失和梯度爆炸导致模型不收敛的问题。其中构建的LSTM模型结果,设置一层LSTM层,然后使用全连接层将LSTM提取的特征线性映射后输入特征融合模块,如图所示: SWLSTM时间特征提取原理,SWLSTM作为LSTM的变种,不仅具有非线性拟合能力,能够有效提取数据的时间特征,同时在保障得到与 LSTM相近预测效果的同时获得更快的收敛速度。其中构建的SWLSTM内部结构(用共享门取代了LSTM的输入门、遗忘门和输出门),直接使用SWLSTM层取代LSTM层,然后使用全连接层将SWLSTM提取的特征线性映射后输入特征融合模块。如图所示: 空时特征融合原理,将CNN提取的特征线性映射后的特征和LSTM提取的特征线性映射后的特征进行进一步的线性映射,消除不同特征直接由于幅度不同导致对有区分度特征的提取不充分问题,其在模型训练过程中使用更加有效率的梯度下降以及反向传播,避免了梯度爆炸和梯度消失问题,同时简化计算过程。 数据域迁移原理,将预先训练好的基于ECG信号(源域)进行心律失常分类的网络重新用于模拟PPG信号(中间域)进行心律失常分类的进一步训练。这样,在对中间域数据进行训练之前,所有关于模型的网络权重都用从源域中获得的值进行初始化(而非重新开始训练时所有参数进行随机化值)。 结构域迁移原理,通过在中间域训练好的模型进行结构微调,保留卷积层参数,将LSTM替换成SWLSTM层,在获得较高模型性能的同时,进一步降低模型的计算量,同时获得真实PPG信号(目标域)的心律失常识别分类模型。 为了达到上述目的,采用下面的技术方案予以实现: 一种基于迁移学习桥接心电信号和脉搏波心律失常分类识别的方法,基于以下定义: 定义:选取固定长度的ECG/PPG信号作为样本数据和对应的心律失常类别作为样本标签。 具体包括如下步骤: - 步骤S1:将采集的ECG历史数据标注样本后进行模型训练;
- 步骤S2:使用滑动窗口法将采集的固定长度的ECG信号,使用训练集共享的标准化参数进行标准化后作为输入,对应分类预测输出心律失常类别为标签;
- 步骤S3:得到CTi-net模型,且保留CTi-net模型各层的权重;
- 步骤S4:将模拟的PPG历史数据标注样本后进行模型训练,其中模型参数使用第3步的权重进行初始化;
- 步骤S5:使用滑动窗口法将采集的固定长度的PPG信号,使用训练集共享的标准化参数进行标准化后作为输入,对应分类预测输出心律失常类别为标签;
- 步骤S6:得到适应中间域的CTi-net模型,且冻结CTi-net模型各卷积层的权重;
- 步骤S7:将真实的PPG历史数据标注样本后进行模型训练,其中模型卷积层参数使用第6步的权重进行保持不变,LSTM用SWLSTM进行替换并随机初始化;
- 步骤S8:得到适应目标域的CSWTi-net模型。
其中标准化的方法为,假设某一变量序列为S₁,...,Sn,记其中平均值和标准差值分别为:μ和σ,则标准化后的序列为: 其中标准化后的序列值的服从正态分布,存储μ和σ的值。 4.技术关键点 技术方法的体现在: - 为充分提取ECG/PPG信号的特征信息,基于卷积神经网络和门长短时记忆网络,提出了提取空时特征信息,然后通过相同全连接单元进行特征融合的深度学习模型CTi-net;
- 使用真实的ECG信号作为源域桥接模拟PPG信号的中间域进行数据域迁移,使得训练模型CTi-net进一步接近目标域的解空间;
- 使用真实的PPG信号对模型CTi-net进行结构上的迁移,得到适合PPG信号进行心律失常分类识别的高性能模型,并且进一步压缩模型的运算量。
提出的模型结构不仅适合于ECG信号的心律失常识别分类,并且可以在减少真实PPG信号量的基础上确保基于PPG信号的心律失常识别分类性能不明显降低。 5.技术效果 如下表所示,提出用于ECG/PPG信号用以不同心律失常识别分类的CSWTi-net模型,使用第一届MIT的数据库进行验证,包括正常 (N)、房颤(AF)、一级房室传导阻滞(I-AVB)、左束支传导阻滞(LBBB)、右束支传导阻滞(RBBB)、房性早搏(PAC)、室性早搏(PVC)六大类,使用准确性能指标:准确率、召回率、特异性和马太相关系数。
|