matlab的旋律 发表于 2018-9-10 09:43:16

卷积神经网络对时序信号的分类预测

本帖最后由 matlab的旋律 于 2019-3-5 01:02 编辑

       人工智能、机器学习和深度学习是当前非常热门的话题,仅在学术界有很多论文,在工业界也有许多的实际运用。在网上很容易找到概念,但是实际中人们又很容易将其混淆。通常来说,三者的关系可以归纳为:人工智能包含机器学习,机器学习包含深度学习,如下面的图所示:图1 人工智能、机器学习和深度学习的关系图
       上面图示深度学习是机器学习分支的概念非常重要,它继承了机器学习依赖模型自身获得参数的优点,同时它又超越了传统机器学习人工提取特征的限制,能够在大数据中进行自学习提取特征。但它同所有机器学习一样受限于训练数据和输入数据不同的问题。       本文要用到的卷积神经网络(ConvolutionalNeural Network,CNN),主要包含卷积技术以及深度神经网络。区别传统的机器学习, 卷积神经网络将特征提取器与机器学习有机的结合了起来。       卷积神经网络处理的数据形式,具有局部与整体的关系,并且由低层次特征组合可以形成高层次的特征,还能得到不同特征间的空间相关性。图像信息具有典型性,因此当前的卷积神经网络技术主要应用在机器视觉领域。其实, 这种局部与整体的关系也可以看作是不同的频率信息构建的特征,许多序列信号也具有这样的特征,以人体信号为例,处于不同频段和幅度的PQRST波构成了ECG信号,而波形的变化也与对应的病征具有很强的关联性。因此,使用CNN对以ECG为代表的时序信号进行处理也是可行的。      有关CNN的原理、特点以及在机器视觉领域的应用已经有非常多的资料可查,这里就不展开叙述了。本文旨在通过对ECG信号的四类目标正常(N),室性早搏(V),右束支阻滞(R),左束支阻滞(L)进行分类,其中的数据样本来源请参阅论坛www.52matlab.com。下面直接通过源码来说明CNN分类过程。Step1: 加载数据,数据以.mat存放在Data文件夹,其中四个.mat文件的文件名对应目标分类值;%% 加载数据;fprintf('Loadingdata...\n');tic;load('Data\N_dat.mat');load('Data\L_dat.mat');load('Data\R_dat.mat');load('Data\V_dat.mat');fprintf('Finished!\n');Step2: 加标签值,给对应的数据加上分类标签,其中的标签用元胞数组表示;%% 控制使用数据量,每一类5000,并生成标签,用1 2 3 4表示fprintf('Datapreprocessing...\n');tic;Nb =Nb(1:5000,: );Label1 =repmat({'N'},1,5000);Vb =Vb(1:5000,: );Label2 =repmat({'V'},1,5000);Rb =Rb(1:5000,: );Label3 =repmat({'R'},1,5000);Lb =Lb(1:5000,: );Label4 =repmat({'L'},1,5000); Data =;Label =; clear Nb;clearLabel1;%定向清除内存clear Rb;clearLabel2;clear Lb;clearLabel3;clear Vb;clearLabel4;fprintf('Finished!\n');toc;Step3: 对数据进行归一化操作,这部分程序直接放在函数CNNModeTrainFunc.m当中调用,对数据归一化主要有两种,一种是最大最小法,对应Matlab库函数mapminmax,一种是平均数方差法,对应Matlab库函数mapstd,归一化的目的主要是消除不同数据采集设备的数量级差别,当然在数据样本较少的情形下也可以认为起到有效特征提取的作用;function =getCNNDataFunc(x,y) Y = categorical(y);for k = 1:length(y)    X(1,:,1,k) = mapstd(x(k,: )); %等价于X(1,:,1,k) = (x(k,: ) -mean(x(k,: ))) / std(x(k,: ));endStep4: 结构层设计,Matlab自带的库函数是处理图像的,因此输入层也是图片的输入格式,但是序列信号可以看作图像信息的特例,将其中的过程矩阵用行向量取代,本文介绍的CNN实例,包含四个卷积层,三个池化层,两个全连接层(即BP网络中的隐藏层),使用的激活函数为ReLU,全连接层的权系数节点丢弃率为0.2,同时设计softmax的多分类;layers = [    imageInputLayer() %输入数据1*250*1    convolution2dLayer(,4,'Padding','same')%滤波器长度为11,个数为4,输出的数据跟输入维度相同    batchNormalizationLayer    reluLayer%激活函数   averagePooling2dLayer(,'Stride',)%平均池化函数,三点平均,滑窗长度为2    convolution2dLayer(,16,'Padding','same')    batchNormalizationLayer    reluLayer    averagePooling2dLayer(,'Stride',)    convolution2dLayer(,32,'Padding','same')    batchNormalizationLayer    reluLayer    averagePooling2dLayer(,'Stride',)       convolution2dLayer(,64,'Padding','same')    batchNormalizationLayer    reluLayer          dropoutLayer(0.2)%权系数节点丢弃率    fullyConnectedLayer(numClasses)    softmaxLayer    classificationLayer];Step5: CNN训练参数的设定,其中的训练方法为’sgdm’ ,即动量驱动的随机梯度下降法,使用验证数据在训练过程中进行实施验证,其中的小批量尺寸设置为120;options =trainingOptions('sgdm',...%动量法驱动的随机梯度下降    'MiniBatchSize',miniBatchSize,...%小批量尺寸大小    'MaxEpochs',9,...%轮数    'InitialLearnRate',1e-3,...%初始学习率    'LearnRateSchedule','piecewise',...    'LearnRateDropFactor',0.1,...    'LearnRateDropPeriod',20,...    'Shuffle','every-epoch',...   'ValidationData',{XValidation,YValidation},...%验证数据   'ValidationFrequency',validationFrequency,...%验证频率    'ValidationPatience',Inf,...    'Plots','training-progress',...    'Verbose',false);Step6: 训练CNN网络;net =trainNetwork(XTrain,YTrain,layers,options);
图2 CNN训练过程

Step7: 使用训练好的CNN网络对输入序列进行预测分类,这里使用验证数据集作为测试数据集,同时给出混淆矩阵绘图。YPred =classify(cnn_net,validation_x, 'MiniBatchSize',miniBatchSize,'SequenceLength', 'longest');plotconfusion(YPred,validation_y');%绘制混淆矩阵
图3 用验证集做测试的混乱矩阵

       通过预测集和实际集的混淆矩阵,可以很具体的分析各类的性能分析,这里不再叙述。对以CNN为代表的深度学习分类方法,对训练和输入数据的一致性要求严格,这也对传感器的稳定性提出了要求,同时在训练过程中也需要尽可能保持各类数据样本的均衡。

技术小白 发表于 2018-11-2 13:05:00

您好,在输入层中,数据大小为什么是1*250*1?

技术小白 发表于 2018-11-2 13:31:56

输入层也是图片的输入格式,但是序列信号可以看作图像信息的特例?博主,这句话怎么理解?

matlab的旋律 发表于 2018-11-5 04:06:03

技术小白 发表于 2018-11-2 13:31
输入层也是图片的输入格式,但是序列信号可以看作图像信息的特例?博主,这句话怎么理解?

比如图像是 64*64*3的三维信号, 序列信号一般是一维或者二维信号,以一维为例,序列信号长为100, 可以当作1*100*1的图像. 当然这里涉及到一个时间的问题, 64*64*3的图像是同一个时间,而这里长为100的时间序列对应的时刻为100个,因此将一维信号当作图像来处理的时候就没有时间这个维度了

leiwang9305 发表于 2020-2-20 08:54:28

博主有没有数据集啊?

matlab的旋律 发表于 2020-2-21 19:10:23

leiwang9305 发表于 2020-2-20 08:54
博主有没有数据集啊?

用的MIT的数据库分割的

leiwang9305 发表于 2020-2-24 16:47:06

可不可以把你分割后的数据集我发一份,QQ邮箱1946604122@qq.com

Neurant 发表于 2020-6-1 02:26:18

matlab的旋律 发表于 2018-11-5 04:06
比如图像是 64*64*3的三维信号, 序列信号一般是一维或者二维信号,以一维为例,序列信号长为100, 可以当作1 ...

请问楼主有完整的代码可以分享吗?例如 XTrain是怎么定义的?数据集的下载链接可以分享一下吗

豹纹096 发表于 2020-6-7 07:29:14

学习了:handshake
页: [1]
查看完整版本: 卷积神经网络对时序信号的分类预测