DEAP数据库的简介

2019-04-13 11:24发布

实验室就自己一个方向:做基于生理信号的情感识别,一直知道有DEAP这个数据库,但是一直没有用,自己建的数据库效果不好,所以准备用DEAP试一试。下面总结一下DEAP库的使用方法。 1、DEAP数据库        首先看一下DEAP的建库流程,首先就是找人在一堆MV中选了40个MV。然后又找了32个测试者(一半男一半女),然后给他们看MV。流程是:2分钟平静---->2秒的显示当前MV序号------->5秒钟的baseline------->1分钟的播放MV----->然后填表评价(arousal, valence, liking and dominance)。        信号有32路EEG信号(512HZ)、GSR信号、EOG信号、EMG信号、PPG信号、Temp(皮温)、Statue(状态信号)        下载官网上他处理好的数据,所有数据都被下采样成了128Hz,其中EEG信号去除了EOG的影响用了一个4.0 ~ 45.0Hz的带通滤波、数据变成了60s的测试信号加上3s的baseline。
        个人感觉采样频率有点过低了,这样的信号效果肯定不会太理想。像EMG的等信号至少也要256Hz的采样频率。 但是我不会去眼电什么的啊。。。。只能迫不得已用这个数据了,毕竟比较新的数据库。         还有就是这个还有3s的baseline这个有点蠢,3s连心跳都跳不了几次,根本就算不来频率信息,尤其是一些低频信号如心率的低频等。 2、看一下这个数据库的一些分析结论。        通过统计发现对于4类状态低效价低唤醒度(LALV)、高效价高唤醒度(HAHV)、同理(LAHV)和(HALV),的统计均值和方差表如下。 然后按照他这个文献的说法是他只下采样到了256Hz,用EEGlab进行了高通滤波、用盲源分离去了EOG,然后用Welch方法提取了3到47Hz的ECG信号,并且把频带分成了几个部分:theta (3 - 7 Hz), alpha (8 - 13 Hz), beta (14 - 29 Hz)和 gamma (30 - 47 Hz),观察了一下用户评分和这几个频带的相关性。 3、分类方式        把情绪识别用3个二分类器表示:高低效价、高低唤醒度、高低liking。可能会有数据不平衡的问题。可以统计F1-score和采用对类不平衡有好的适应性的方法,并且用Fisher线性判别进行特征选择。他提了下面这些特征: 这些低频特征真是提的有点费力,因为时间太短了。