机器学习与脑电信号分析相结合的眩晕状态分类

doi:10.12307/2022.844

摘要/Abstract

摘要：

文题释义：
机器学习：是一门多领域交叉融合的学科，涉及统计学、算法理论、概率论等基础理论。目前，机器学习在医疗诊断领域得到了迅速发展。该研究应用前庭电刺激诱发眩晕症状，通过逻辑回归、支持向量机、反向传播以及随机森林对不同等级的眩晕症状进行分类研究，其中随机森林模型分类检测效果明显，准确率最高可达82.5%。
脑电信号分析：是解析大脑皮质神经电活动信号的有效方法。由于脑电信号属于非线性时变随机的复杂信号，对其研究一直是非常吸引人但又具有相当难度的研究课题。常用的信号处理方法有快速傅里叶变换法、短时傅里叶变换法、功率谱分析法以及小波变换等，该研究通过小波分解算法提取小波能量以及小波熵的脑电特征，采用多种有监督式机器学习分类器实现了对不同眩晕等级的分类。

背景：脑电图是临床上检测及分析眩晕的一种常用手段，目前多采用单极或多级导联描记并分析脑电频率是否异常。但眩晕的脑电活动过程是异常复杂的，仅采用频率快慢分析的方法，很难对眩晕状态进行准确的分类和检测。
目的：将机器学习与脑电信号分析相结合对眩晕状态进行分类，这对眩晕的诊断具有一定的研究意义和临床应用价值。
方法：采用无创的前庭功能调节技术前庭电刺激制造可逆的眩晕状态，刺激电流强度为1，2，4倍皮肤感知阈值，被试在不同强度电流刺激后需填写眩晕残障量表，根据眩晕障碍量表评估结果将眩晕症状分为不同的等级，以此作为脑电分类有监督学习的数据标签。采集刺激后的脑电信号，通过小波变换提取脑电信号的小波能量以及小波熵的样本特征，利用多种机器学习分类模型对有无眩晕以及不同等级眩晕的样本特征进行分类。
结果与结论：①通过对多种分类模型分类结果的对比发现：基于脑电信号小波变换特征的有监督学习分类可以实现是否眩晕和眩晕等级的二分类和多分类；②随机森林分类模型较逻辑回归模型、支持向量机模型、反向传播神经网络模型在眩晕检测的二分类以及多分类问题上表现出较高的准确率，其中二分类准确率最高可达82.5%，操作特性曲线面积为0.913，三分类准确率最高可达75.8%，操作特性曲线面积为0.927；③结果表明，随机森林模型在有无眩晕及眩晕等级的脑电特征分类问题上具有较高的准确率。该方法为眩晕症状的分类检测提供了一种可行性的补充方案，为眩晕症的诊断提供了一个新的思路。

https://orcid.org/0000-0001-6310-3689(耿跃华)；https://orcid.org/0000-0002-6098-8132(石金祥)

中国组织工程研究杂志出版内容重点：组织构建；骨细胞；软骨细胞；细胞培养；成纤维细胞；血管内皮细胞；骨质疏松；组织工程

关键词: 前庭电刺激, 眩晕, 脑电信号, 小波变换, 分类算法

Abstract: BACKGROUND: Electroencephalogram (EEG) is a common means to detect and analyze vertigo in clinic. Currently, unipolar or multistage lead tracing is mostly used to record and analyze whether the EEG frequency is abnormal. However, the EEG process of vertigo is extremely complex. It is difficult to accurately classify and detect the vertigo state only using a frequency speed analysis.
OBJECTIVE: To classify the types of vertigo based on the combination of machine learning and EEG signal analysis, which has certain research significance and clinical application value for the diagnosis of vertigo.
METHODS: The non-invasive vestibular function regulation technology for vestibular electrical stimulation was used to create a reversible vertigo state. The stimulation current intensity was 1, 2, and 4 times that of the skin perception threshold. All subjects were required to fill in a dizziness handicap inventory after different intensity current stimulations. The vertigo symptoms were divided into different grades according to the evaluation results of the dizziness handicap inventory, which was used as the data label for supervised learning of EEG classification. The stimulated EEG signals were collected, the wavelet energy and wavelet entropy sample features of EEG signals were extracted by wavelet transform, and a variety of machine learning classification models were used to classify the features of samples with or without vertigo and with different levels of vertigo.
RESULTS AND CONCLUSION: By comparing the classification results of various classification models, we found that the supervised learning classification based on the wavelet transform characteristics of EEG signals could realize the binary classification and multi-classification of vertigo and vertigo level. Compared with logistic regression model, support vector machine model, back propagation neural network model, and random forest classification model showed higher accuracy in the binary classification and multi-classification of vertigo detection. The accuracy of the binary classification was up to 82.5% and the operating characteristic curve area was 0.913; the accuracy of the three-way classification was up to 75.8% and the operating characteristic curve area was 0.927. All these findings indicate that the random forest model has a relatively higher accuracy in the classification of EEG features with or without vertigo and vertigo level. This method provides a feasible supplementary scheme for the classification and detection of vertigo symptoms and offers a new perspective on the diagnosis of vertigo.

Key words: vestibular electrical stimulation, vertigo, electroencephalogram, wavelet transform, classification algorithm

中图分类号:

耿跃华, 石金祥. 机器学习与脑电信号分析相结合的眩晕状态分类[J]. 中国组织工程研究, 2022, 26(29): 4624-4631.

Geng Yuehua, Shi Jinxiang. Classification of vertigo state based on machine learning and electroencephalogram signal analysis[J]. Chinese Journal of Tissue Engineering Research, 2022, 26(29): 4624-4631.

图/表（结果） 10

2.1 眩晕障碍量表分析 37名被试经1，2，4倍阈值刺激之后的眩晕障碍量表测评结果，见图8。将不同倍数阈值刺激的测评结果进行两两配对样本t检验，不同倍数阈值刺激作用后眩晕障碍量表统计学分析结果，见表2。

将眩晕障碍量表测评分数按照评估标准划分为3个不同的眩晕等级[29]。将不同刺激电流强度与眩晕障碍量表眩晕等级采用Spearman相关性方法分析，统计学分析结果，见表3。

2.2 二分类结果在二分类研究中，是否存在眩晕症状的准确率、精度、召回率、调和平均值和接受者操作特性曲线的检测结果，见表4。各二分类模型的操作特性曲线，见图9。各二分类模型的混淆矩阵，见图10。

2.3 多分类结果各多分类模型的操作特性曲线，见图11。各个多分类模型的混淆矩阵，见图12。在多分类研究中，对于不同眩晕等级的准确率、精度、召回率、调和平均值和接受者操作特性曲线的检测结果，见表5。

2.4 验证结果比较以上多种分类器模型，可以发现随机森林模型在二分类以及多分类检测问题上表现性能最好，准确率分别可达82.5%和75.8%，因此选择随机森林分类器在不同被试上进行验证。选取15名被试的试验数据作为验证集，将上述训练好的随机森林分类模型分别在单个被试样本特征上验证其准确率，观察对单个被试的眩晕等级进行分类是否具有可适性。15名被试眩晕等级的准确率验证结果，见表6，结果显示：随机森林在验证集上表现出了较高的分类准确性。

参考文献

[1] 刘畅,刘大新,丁雷,等.眩晕疾病的发病率与患病特征分析[J].中华耳鼻咽喉头颈外科杂志,2013,18(10):862-864.
[2] KELLOGG RS, KENNEDY RS, GRAYBIEL A. Motion sickness symptomatology of labyrinthine defective and normal subjects during zero gravity maneuvers. Aerosp Med. 1965;36:315-318.
[3] KENNEDY RS, LANE NE, BERBAUM KS, et al. Simulator Sickness Questionnaire (SSQ): A new method for quantifying simulator sickness. Int J Aviat Psychol. 1993;3:203-220.
[4] JACOBSON GP, NEWMAN CW. The development of the Dizziness Handicap Inventory. Arch Otolaryngol Head Neck Surg. 1990;116(4): 424-427.
[5] EGGERS SDZ, BISDORFF A, VON BREVERN M, et al. Classification of vestibular signs and examination techniques: Nystagmus and nystagmus-like movements. J Vestib Res. 2019;29(2-3):57-87.
[6] 梁飞,刘俊平,李垚.眼震视图在BPPV与VM鉴别诊断中的应用[J].中外医学研究,2021,19(27):64-67.
[7] KIM DW, SUNWOO JS, LEE SK. Incidence and localizing value of vertigo and dizziness in patients with epilepsy: Video-EEG monitoring study. Epilepsy Res. 2016;126:102-105.
[8] POLLAK L, SCHIFFER J, KLEIN C, et al. Quantified EEG in patients with vertigo of central or peripheral origin. Int J Neurosci. 1998;93(1-2):35-41.
[9] MOHAMED EA, YUSOFF MZ, MALIK AS, et al. Comparison of EEG signal decomposition methods in classification of motor-imagery BCI. Multimedia Tools and Applications. 2018;77(16):21305-21327.
[10] 李德豪.基于EEG的视觉诱导晕动症评估与检测[D].重庆:重庆大学,2018.
[11] 王宏,赵海滨,刘冲.采用小波熵和频带能量提取脑电信号特征[J].吉林大学学报,2011,41(3):828-831.
[12] BURKE DP, KELLY SP, DE CHAZAL P, et al. A parametric feature extraction and classification strategy for brain-computer interfacing. IEEE Trans Neural Syst Rehabil Eng. 2005;13(1):12-17.
[13] 周天一.个体化脑电功率谱和脑网络分析方法的研究与应用[D].秦皇岛:燕山大学,2020.
[14] FAUST O, ACHARYA UR, ADELI H, et al. Wavelet-based EEG processing for computer-aided seizure detection and epilepsy diagnosis. Seizure. 2015;26:56-64.
[15] VIVAR G, STROBL R, GRILL E, et al. Using Base-ml to Learn Classification of Common Vestibular Disorders on DizzyReg Registry Data. Front Neurol. 2021;12:681140.
[16] 申俞文.基于多分类逻辑回归的微表情识别模型[D].徐州:中国矿业大学,2020.
[17] 刘宝,蔡梦迪,薄迎春,等.一种基于PSO-CSP-SVM的运动想象脑电信号特征提取及分类算法[J].中南大学学报(自然科学版),2020, 51(10):2855-2866.
[18] 郭宇.基于迭代随机森林算法的脑电信号分类研究[D]. 长春:长春工业大学,2020.
[19] 冯国航,邵冰莓,王柏弋,等.人工神经网络在脑电信号处理中的应用[J].电子世界,2019(10):52-53.
[20] MITSUTAKE T, SAKAMOTO M, KAWAGUCHI A, et al. Greater functional activation during galvanic vestibular stimulation is associated with improved postural stability: a GVS-fMRI study. Somatosens Mot Res. 2020;37(4):257-261.
[21] FITZPATRICK RC, WARDMAN DL, TAYLOR JL. Effects of galvanic vestibular stimulation during human walking. J Physiol. 1999;517 ( Pt 3)(Pt 3): 931-939.
[22] FITZPATRICK RC, MARSDEN J, LORD SR, et al. Galvanic vestibular stimulation evokes sensations of body rotation. Neuroreport. 2002; 13(18):2379-2383.
[23] VOLKENING K, BERGMANN J, KELLER I, et al. Verticality perception during and after galvanic vestibular stimulation. Neurosci Lett. 2014; 581:75-79.
[24] FITZPATRICK RC, DAY BL. Probing the human vestibular system with galvanic stimulation. J Appl Physiol (1985). 2004;96(6):2301-2316.
[25] ANGELAKI DE, CULLEN KE. Vestibular system: the many facets of a multimodal sense. Annu Rev Neurosci. 2008;31:125-150.
[26] BLINI E, TILIKETE C, FARNÈ A, et al. Probing the role of the vestibular system in motivation and reward-based attention. Cortex. 2018;103: 82-99.
[27] AOKI O, OTANI Y, MORISHITA S. Effect of Eye-Object Distance on Body Sway during Galvanic Vestibular Stimulation. Brain Sci. 2018;8(11):191.
[28] UTZ KS, DIMOVA V, OPPENLÄNDER K, et al. Electrified minds: transcranial direct current stimulation (tDCS) and galvanic vestibular stimulation (GVS) as methods of non-invasive brain stimulation in neuropsychology--a review of current data and future implications. Neuropsychologia. 2010;48(10):2789-2810.
[29] 谷李欣,陈建勇,张勤,等.后半规管良性阵发性位置性眩晕病程对复位成功后残余症状的影响[J].临床耳鼻咽喉头颈外科杂志, 2021,35(11):976-980.
[30] XU P, DAVOINE F, ZHA H, et al. Evidential calibration of binary SVM classifiers. International Journal of Approximate Reasoning. 2016;72: 55-70.
[31] 黄蓉,付才英.药物性前庭功能损害并脑电图异常1例报告[J].临床脑电学杂志,1998,7(2):53.
[32] KO LW, CHIKARA RK, CHEN PY, et al. Noisy Galvanic Vestibular Stimulation (Stochastic Resonance) Changes Electroencephalography Activities and Postural Control in Patients with Bilateral Vestibular Hypofunction. Brain Sci. 2020;10(10):740.
[33] GORDON AG. Electroencephalography in dizzy patients. Acta Neurol Scand. 1989;79(6):521-522.
[34] MORANO A, CARNÌ M, CASCIATO S, et al. Ictal EEG/fMRI study of vertiginous seizures. Epilepsy Behav. 2017;68:51-56.
[35] AKBARI H, SADIQ MT, REHMAN AU. Classification of normal and depressed EEG signals based on centered correntropy of rhythms in empirical wavelet transform domain. Health Inf Sci Syst. 2021;9(1):9.
[36] 张绍荣,赵紫宁,李智,等.WPD-CSP脑电特征提取方法的时间优化[J].计算机工程与设计,2021,42(6):1645-1652.
[37] NABIL D, BENALI R, BEREKSI REGUIG F. Epileptic seizure recognition using EEG wavelet decomposition based on nonlinear and statistical features with support vector machine classification. Biomed Tech (Berl). 2020;65(2):133-148.

引言

眩晕是临床上常见的一种综合征，它的发病率很高，在中国可高达5%[1]。目前，临床上对眩晕的检测方法主要有眩晕主观评价量表，包括眩晕障碍量表、晕动症问卷以及模拟晕动症问卷等[2-4]。眩晕障碍量表是国际上广泛应用的评定眩晕的量表，多数患者的眩晕症状应用此量表进行诊断与评估，但量表的评估指标有限，无法表征和评估所有的眩晕症状，而且量表的主要检测信息来自于被试者的主观感受，而被试的主观感受受个人心理以及情绪的影响较大，因此单纯依靠眩晕障碍量表的评分结果进行眩晕检测缺乏客观性。另外，眩晕患者可以通过眼震视图来检测眼动、眼震偏移量等特征[5-6]，从而评估眩晕状态，但眼震的发生成因复杂，有耳源性眼震、眼源性眼震和中枢神经性眼震等，因此单纯依赖眼动以及眼震特征尚不能准确实现对眩晕的诊断及眩晕等级的鉴别，在实际临床应用中存在很大的局限性。脑电图检查也是一种眩晕状态的检测手段，它可以监测眩晕发生时皮质神经电活动的异常，目前脑电图检测多采用单极或多极导联描记脑电信号并分析脑电频率是否异常[7-8]。但是眩晕的脑电活动过程是复杂的，仅采用分析频率快慢的方法，无法分析出大脑在眩晕状态下神经电活动的多维特征，也很难对眩晕状态进行准确的分类和检测，该研究将通过提取脑电信号的时频特征来完成对眩晕症状高精度的检测与分类，为当前眩晕的检测提供更为有效和准确的技术手段。

在基于脑电特征的眩晕状态分类研究中，如何提取脑电信号的特征是实现精确分类的重要环节。脑电特征提取的方法有多种，其中比较典型的是快速傅里叶变换、短时傅里叶变换、功率谱分析以及小波变换等[9-13]。由于小波函数具有较好的时频伸缩性，对频率和时间的分辨率较傅里叶变换有明显的优势，因此在脑电信号频率特征提取中得到了广泛的应用。近年来，随着机器学习算法的普及与应用，基于机器学习的脑电特征提取与分类也已用在很多疾病的诊断中[14]，其中设计合理的分类器是决定检测效果的关键因素。目前应用比较广泛的分类模型主要有逻辑回归、支持向量机、随机森林和神经网络[15-19]。这些算法分别有各自的特点，对同一个特征样本集往往会表现不同的分类性能。因此，该研究将采用这4种分类模型进行样本分类并对比分析，评估分类器性能。

前庭电刺激是一种非侵入的神经调控技术[20]。自20世纪初，人们就知道前庭电刺激会引起健康人的眩晕症状[21-23]，因此许多科学研究将它用作诱发眩晕的手段来研究前庭系统的功能[24]。有试验表明前庭电刺激在健康成人以及完全单侧前庭缺失患者中可以诱发眼球震颤，影响空间感知，引发眩晕[25-27]。由此可见，前庭电刺激可以引发可逆的眩晕症状，因此它成为一种人为诱发眩晕的科学研究手段。

基于以上学者的工作，该研究通过可逆的前庭电刺激技术将正常健康被试者诱发不同等级的眩晕症状，采用眩晕障碍量表统计学分析产生的眩晕等级作为分类标签，通过小波分解提取脑电特征，采用多种有监督机器学习分类器对脑电特征进行分类，找到分类精确度较高的分类模型作为最优分类模型，这将为今后的眩晕检测和评估提供一种具有较高精确度的可行性补充方案。
中国组织工程研究杂志出版内容重点：组织构建；骨细胞；软骨细胞；细胞培养；成纤维细胞；血管内皮细胞；骨质疏松；组织工程

材料方法

1.1 设计眩晕基于脑电信号的分类研究。
1.2 时间及地点试验于2020年9月至2021年11月在河北工业大学电气工程学院生物医学工程系脑电信号采集与处理实验室完成。
1.3 对象在校园内招募志愿者，选取37名在校大学生作为健康被试，其中男22名，女15名；年龄20-28岁，平均年龄24.8岁；皆为右利手。所有被试均不存在任何精神和神经类疾病，体内无植入器件。参加试验前被试应得到充足的睡眠和休息，以便集中精神配合试验。试验前已告知试验内容，并签署了知情同意书，参加试验前均未接触过类似的相关试验。被试在试验过程中闭眼，佩戴耳塞，并保持安静清醒。该研究的实施符合河北工业大学的相关伦理要求，河北工业大学伦理委员出具了伦理审查证明(HEBUThMEC2020007)。
1.4 方法
1.4.1 刺激试验采用的前庭电刺激设备为德国Neuroconn公司生产的前庭神经电刺激仪。刺激模式选择为DC模式，淡入淡出时间设置为10 s，刺激持续时间为1 min，刺激电流的变化，见图1。选取左右乳突作为刺激点，将刺激电极阴阳两极贴片分别放置于左右乳突位置上，刺激电极位置，见图2。

首先，进行皮肤感知阈值测试，即电流强度从20 μA开始，施加20 s电流刺激。如果被试没有报告刺痛感，电流强度就以20 μA的增量递增再进行电流刺激，以此类推。相邻2次刺激间隔至少为10 min，以防止滞后效应影响下一次测试。直到被试口头报告在刺激区域感受到轻微的局部刺痛感，测试结束。这时的刺激电流强度即为皮肤感知阈值电流强度。而后以1，2，4倍皮肤感知阈值的电流强度来进行前庭电刺激。根据目前直流电刺激的安全指导参数，最大刺激电流不超过2 mA，最长持续时间不超过20 min。在安全指导参数下将直流电应用于皮质，无论是对健康人还是有神经病学疾病患者，不良作用都很小[28]，该试验刺激电流强度和持续时间严格符合安全指导参数。为防止不同阈值电流强度刺激试验的叠加效应，不同的阈值刺激试验前后间隔时间为10 min以上。
1.4.2 眩晕障碍量表评估眩晕障碍量表共25个问题，分别评定患者的躯体、情绪和功能3方面的损害程度，分别有7，9，9个问题，对应的分值为28，36，36分，每个问题都会有3个选项供患者选择，分别是“是、有时、无”，相应计分为“4，2，0”分。总分为3方面评分之和，满分为100分，得分越高，主体症状与躯体、情绪和功能障碍越严重。依据评分的等级标准，0-30分为轻度障碍(Ⅰ级眩晕等级)，31-60分为中度障碍(Ⅱ级眩晕等级)，61-100分为重度障碍(Ⅲ级眩晕等级)。上述量表皆为自填问卷，测评时需向患者说明调查的目的、意义及填写要求，让被试如实、独立填写[29]。
为了将前庭电刺激引起的眩晕效果进行具体量化，被试在不同强度电流刺激前后需要填写眩晕障碍量表，为确保测评结果的准确性，要求每位被试熟悉了解刺激试验流程以及量表内容填写规则，对某一强度的刺激电流重复刺激3次，取3次测评结果的平均值作为最终的测评结果。根据测评分数的统计学分析将不同眩晕症状划分为Ⅰ、Ⅱ、Ⅲ等级。以此作为脑电信号小波分解特征分类的有监督学习分类标签。
1.4.3 脑电试验采用的脑电采集系统为美国Neuroscan公司生产的ESI-128脑电信号采集分析系统。试验中记录64导电极的脑电信号，采样频率为1 000 Hz，电极阻抗参考阈值为5 kΩ，左右耳垂作为参考电极。对每位被试分别在刺激前后采集60 s脑电信号。将采集到的脑电信号按眩晕障碍量表测评分数得到的眩晕等级来标记和划分，作为分类样本。
1.5 数据处理方法
1.5.1 脑电数据预处理利用MATLAB软件工具箱EEGLAB对脑电信号进行预处理。主要包括通过PCA主成分分析法去除眼电、肌电，去除工频伪迹干扰，进行0.5-45 Hz范围的带通滤波，剔除坏导、坏段，对脑电信号进行分段和基线校正，分段提取刺激前和刺激后的试验数据。
1.5.2 小波分解小波分析是一种时间和尺度熵的局部分析方法，它对信号具有自适应性。小波变换可以把原始信号分成不同的频段，进而获得有效的时频信息。小波变换的双尺度方程为：

其中，h(k)，g(k)是尺度函数与小波函数的滤波器系数，也是多分辨分析中的滤波系数。当n=0时。w0(t)=φ(t)，w1=(t)=Ψ(t)。其中，w0(t)=φ(t)为尺度函数，w1(t)=Ψ(t)为小波函数。｛wn=(t)，n∈z｝为由w0(t)=φ(t)所确定的小波包。根据小波包变换的性质，可以得到小波包系数的递推公式为：

小波包的节律能量均值定义为：

其中，N为采样点个数，d1-d6为各个节律的小波系数，Ei为第i个节律波的平均能量。对其值进行归一化处理，信号的总能量E为各个频带能量之和。

Pn为相对小波能量，计算公式如下：

小波熵WE(p)的公式如下：

采用小波基为db4，用8层小波包分解，提取能近似反映不同的脑电节律low-δ(0.5-2 Hz)，high-δ(2-4 Hz)，θ(4-8 Hz)，α(8-13 Hz)，β(13-30 Hz)，γ(30-45 Hz)的小波系数。其中，各个小波系数划分的频带范围，见表1。这里将此次试验采集的一段3 s的脑电信号进行小波分解，原始脑电信号，见图3，小波系数波形以及对应的频谱，见图4和图5。

1.5.3 脑电信号分类特征的提取为提取脑电信号的分类特征，取代表不同脑区的9个典型电极(FP1，FP2，P1，P2，T7，T8，CZ，O1，O2)。设1.5 s为小波变换的单位，取其小波系数能量以及小波熵作为样本特征，得到了8 880行63列的数据集。训练集与测试集的划分比例为7∶3，为保证模型对样本特征的适应性，在划分数据集前均进行归一化和交叉验证处理。由于健康被试刺激前无眩晕症状而且刺激后会引起健康被试明显的眩晕症状，因此将无眩晕症状的数据特征标签设定为0类，对存在眩晕症状的数据特征标签设定为1类，对有无眩晕症状的样本特征进行二分类研究。根据眩晕障碍量表的评测结果将刺激后引起的眩晕症状划分为Ⅰ、Ⅱ、Ⅲ这3个等级，为了对存在眩晕症状的样本特征进行检测分类，依次将眩晕等级为Ⅰ、Ⅱ、Ⅲ级的样本特征的标签设定为1，2，3类，对这3种不同等级的眩晕样本特征进行多分类研究。
1.5.4 分类算法
(1)逻辑回归分类：逻辑回归是一种比较有效和实用的分类算法，逻辑回归算法是基于多元线性回归的算法，而多分类逻辑回归是逻辑回归的扩展延伸，可以进行多类别预测。与其他分类器相比，多分类逻辑回归有一定的优势，算法对高维数据有更好的计算能力，逻辑回归算法如下：
①构造逻辑回归的预测函数hθ(x)：

其中，x为输入特征，θ为估计量，当Logistic回归用来分类标签0和1问题时，就转化为预测标签概率问题。

其中，x为输入特征，y为标签，θ为估计量。
②构造损失函数cos t(hθ，y)和j(θ)，假设存在有m个样本且每个样本有n个特征。

③为使得损失j(θ)最小，采用梯度下降法更新迭代θ，求解最优参数θ，进而得出预测结果。

其中，j=0，1，2，…，n；α为更新步长。
(2)支持向量机：支持向量机通过将低维度的信号映射到高维度的特征空间，实现将样本特征进行更好地分离[30]，从而用于模式分类和非线性回归。支持向量机的主要思想是建立一个分类超平面作为决策曲面，使得正例和反例之间的隔离边缘最大化。支持向量机最终决策函数只是由少数的支持向量所决定，计算的复杂性取决于支持向量的数目，而不是样本空间的维数，这在某种意义上避免了“维数灾难”。这里以二分类模型为例介绍其基本原理，其中，C-SVC模型是比较常见的二分类支持向量机模型，其具体形式如下：

①设已知训练集：其中，X为特征向量，Y为标签。
②选取适当的核函数K(x，x’)和适当的参数C，构造并求解最优化问题：

得到最优解：α*=｛α1*，…，αl*｝T
③选取α*的一个正分量，0<αj*<C并据此计算阈值：

④构造决策函数：

(3)随机森林分类：随机森林算法实质是一个包含多个决策树的分类器，这些决策树的形成采用了随机方法，随机森林中的树之间是没有关联的。当测试数据进入随机森林时，其实就是让每一棵决策树进行分类，其输出的类别是由个别决策树输出的类别的众数而定，最后取所有决策树中分类结果最多的那类为最终结果，随机森林算法的结构示意图，见图6。随机森林算法在构建决策树的时候，采用了随机选取分类属性集的方法。详细的随机森林算法如下所示(设样本的属性个数为M，m为大于0且小于M的整数)：

①利用Bootstrap方法重采样，随机产生T个训练集S1，S2，S3，…，ST。
②利用每个训练集，生成对应的决策树D1，D2，…，DT；在每个非叶子节点(内部节点)上选择属性前，从M个属性中随机抽取m个属性作为当前节点的分类属性集，并以这m个属性中最好的分裂方式对该节点进行分裂(一般而言，在整个森林的成长过程中，m的值维持不变)。
③每棵树都完整成长，而不进行剪枝。
④对于测试集样本X，利用每个决策数进行测试，得到对应的类别D1(X)，D2(X)，…，DT(X)。
⑤利用投票的方法，将T个决策树中输出最多的类别作为测试集样本X所属的类别。
(4)反向传播神经网络(BP神经网络)分类：反向传播神经网络是一种多层前馈神经网络，该网络的主要特点是信号前向传递，误差反向传播。在前向传递中，输入信号从输入层经隐含层处理，直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出，则转入误差反向传播，根据预测误差调整网络权值和阈值，从而使反向传播神经网络预测输出不断逼近期望输出。反向传播神经网络的拓扑结构，见图7。

反向传播神经网络的训练过程包括以下几个步骤：
①网络初始化。根据系统输入输出序列(X，Y)确定网络输入层节点数n、隐含层节点数l，输出层节点数m，初始化输入层、隐含层和输出层神经元之间的连接权值wij，wjk。初始化隐含层阈值a，输出层阈值b，给定学习速率和神经元激励函数。
②隐含层输出计算。根据输入变量X，输入层和隐含层间连接权值wij以及隐含层阈值a，计算隐含层输出H。

式中，l为隐含层接点数；f为隐含层激励函数，该函数有多种表达形式，文中所选函数为：

③输出层输出计算。根据隐含层输出H，连接权值wjk和阈值b，计算反向传播神经网络预测输出O。

④误差计算。根据网络预测输出和期望输出Y，计算网络预测误差e。

⑤权值更新。根据网络预测误差e更新网络连接权值wij，wjk。

其中，i=1，2，…，n，j=1，2，…，l。

其中，j=1，2，…，l，k=1，2，…，m，式中η为学习速率。
⑥阈值更新。根据网络预测误差更新网络节点阈值a，b。

其中，j=1，2，…，l，k=1，2，…，m。
⑦判断算法迭代是否结束，若没有结束，返回步骤②。
1.6 主要观察指标为了更好地评估机器学习模型的分类性能，采用准确率、精确率、召回率、调和平均值、接受者操作特性曲线(ROC)以及操作特性曲线下面积(AUC)这6个评价指标来综合评估不同模型的分类效果。定义TP、TN、FP、FN分别为真阳性、真阴性、假阳性、假阴性。其中，准确率、精确率、召回率、调和平均值的计算公式如下：

1.7 统计学分析利用SPSS 21.0软件将1，2，4倍阈值刺激的眩晕障碍量表评分两两进行配对样本t检验，分析其显著性差异。不同刺激电流强度与眩晕障碍量表眩晕等级两者之间的关系采用Spearman相关性方法进行分析，观察并分析刺激电流强度与眩晕等级之间的相关性。

讨论

有很多研究表明，眩晕患者的大脑皮质存在复杂的节律震荡[31-32]，脑电活动丰富的频率信息为眩晕症状的检测提供了有利的条件。脑电信号是随机时变的，提取脑电信号中的有效频域特征是实现眩晕检测的可行手段。但是常规脑电图不够敏感，无法检测头晕患者的细微变化[33]。近年来普遍采用的基于脑电节律的视频脑电图检测，也只能对与眩晕相关的皮质进行定位研究。例如KIM等[7]对癫痫性眩晕患者进行了视频脑电图监测，以此评估这些患者的致痫灶分布；MORANO等[34]也做了相似的工作。到目前为止，基于脑电特征的眩晕等级分类研究还比较少。

该研究通过眩晕障碍量表评测结果将健康被试前庭电刺激后引起的不同眩晕症状划分为Ⅰ、Ⅱ、Ⅲ3个等级，根据表2和表3对眩晕等级与刺激电流强度的统计学分析结果可以发现，眩晕等级与电流强度具有强相关性，1，2，4倍阈值强度大小的电流可以有效引起Ⅰ、Ⅱ、Ⅲ级眩晕症状。在机器学习信号分类研究中，很多学者采用小波分解的方法提取样本特征均达到了预期的分类效果[35-37]，该研究同样采用小波分解的方法提取脑电信号中时间和频率的有效特征作为分类特征，眩晕障碍量表统计学分析得到的Ⅰ、Ⅱ、Ⅲ眩晕等级作为分类标签，采用应用领域广泛且性能较为成熟的逻辑回归、支持向量机和随机森林以及反向传播神经网络4种分类算法作为分类器，进行有监督的机器学习。检测分类的结果显示：4种分类器均可以实现基于脑电信号小波变换特征的有监督学习分类，其中既可以实现是否存在眩晕的二分类，也可以实现3种眩晕等级的多分类。在二分类问题上，由表4可见随机森林分类算法表现出较高的准确率，准确率达到82.5%。在三分类问题上，由表5可见随机森林分类算法较其他算法也略有优势，准确率可达75.8%，该准确率相较于学者李德豪基于脑电信号的视觉诱导晕动症中二分类76.5%的准确率以及多分类60.5%的准确率均有明显提
高[10]。从图9和图11的操作特性曲线上看，随机森林分类器在众多分类算法中对样本的识别能力最高，灵敏度最高，分类准确度最高。为了验证训练好的随机森林分类模型对单个被试的眩晕等级分类是否具有可适性，分别对15名不同被试的样本数据进行验证。由表6可见，15名被试的二分类准确率的平均值为78.1%，其中4号被试的检测取得最大值，可达86.4%；多分类准确率的平均值为72.6%，其中3号被试的检测取得最大值，可达78.6%。综上所述，前庭电刺激技术是一种可以在健康人体上引发不同等级眩晕症状的可靠有效的技术手段，为眩晕症的研究提供可行的技术支持。基于脑电小波特征的机器学习分类算法可以实现对人体眩晕状态的分类检测。在众多分类器模型中，随机森林模型在不同被试的眩晕等级检测中取得了可观的分类效果，进一步验证了将小波能量和小波熵作为脑电信号的分类特征对眩晕状态进行分类和检测具有可行性。该方法既可以实现眩晕状态的判断，也可以实现不同眩晕等级的分类检测。该试验中用于分类检测眩晕症状的脑电信号是通过外部前庭电刺激引发的，是否对临床上眩晕症状患者自发的脑电信号有同样的分类检测效果需要进一步研究。

结论：临床上很多因素都可以引起眩晕症状，其中前庭器官病变引起的眩晕占很大比例。该研究采取前庭电刺激来模拟不同程度的前庭性眩晕，以小波能量以及小波熵作为分类特征，采用4种分类器实现了对不同等级眩晕的检测，其中随机森林模型的分类效果优势较为明显，为最理想的分类器。该研究将为眩晕症的检测和评估提供一种有效的技术手段，具有一定的科研和临床应用价值。在今后的研究中，如何充分地提取眩晕脑电信号的特征以及如何设计分类性能更好的检测算法来进一步提高检测准确度是今后主要的研究方向。
中国组织工程研究杂志出版内容重点：组织构建；骨细胞；软骨细胞；细胞培养；成纤维细胞；血管内皮细胞；骨质疏松；组织工程