构建基于机器学习的脑卒中后失语症患者功能性语言沟通能力预测模型及评价

doi:10.12307/2026.911

中国组织工程研究 ›› 2026, Vol. 30 ›› Issue (36): 9604-9612.doi: 10.12307/2026.911

• 组织构建临床实践 clinical practice in tissue construction • 上一篇下一篇

构建基于机器学习的脑卒中后失语症患者功能性语言沟通能力预测模型及评价

黄韵诗，柴林松，倪静蕾，左双，林冰冰，黄佳

福建中医药大学康复医学院，福建省福州市 350122

收稿日期:2025-10-29 出版日期:2026-12-28 发布日期:2026-05-26
通讯作者: 黄佳，教授，博士生导师，福建中医药大学康复医学院，福建省福州市 350122
作者简介:黄韵诗，女，2000年生，广东省东莞市人，汉族，福建中医药大学在读硕士，主要从事神经系统疾病康复方面的研究。
基金资助:
国家自然科学基金项目(82074512)，项目负责人：黄佳；福建省科技计划项目社会发展引导性(重点)项目(2023Y0035)，项目负责人：黄佳；福建省自然科学基金(杰青项目)(2024J010033)，项目负责人：黄佳

Development and evaluation of a prediction model for functional language communication outcomes in post-stroke aphasia patients

Huang Yunshi, Chai Linsong, Ni Jinglei, Zuo Shuang, Lin Bingbing, Huang Jia

College of Rehabilitation Medicine, Fujian University of Traditional Chinese Medicine, Fuzhou 350122, Fujian Province, China

Received:2025-10-29 Online:2026-12-28 Published:2026-05-26
Contact: Huang Jia, Professor, Doctoral supervisor, College of Rehabilitation Medicine, Fujian University of Traditional Chinese Medicine, Fuzhou 350122, Fujian Province, China
About author:Huang Yunshi, MS candidate, College of Rehabilitation Medicine, Fujian University of Traditional Chinese Medicine, Fuzhou 350122, Fujian Province, China
Supported by:
National Natural Science Foundation of China, No. 82074512 (to HJ); Fujian Province Science and Technology Planning Project - Social Development Guidance (Key) Project, No. 2023Y0035 (to HJ); Fujian Provincial Natural Science Foundation (Outstanding Youth Project), No. 2024J010033 (to HJ)

摘要/Abstract

摘要：

文题释义：
脑卒中后失语症：指因脑卒中(脑血管意外)导致大脑语言功能区损伤而引起的获得性语言障碍，表现为口语表达、听觉理解、阅读或书写能力的部分或全部丧失，语言功能恢复程度存在显著个体差异，精准预测预后对制定个性化康复方案至关重要。
机器学习：作为人工智能的核心分支，指计算机系统通过算法从历史数据中自动学习内在规律和复杂模式，构建具有预测能力的模型(如支持向量机、随机森林、神经网络等)，在医学领域特别适用于处理多维度临床特征以预测疾病结局或风险。

背景：大多数脑卒中后失语症患者发病1年后仍存在基础交流能力缺陷，亟需建立精准预后预测工具指导临床康复决策。
目的：构建基于机器学习的脑卒中后失语症患者出院时语言功能预后预测模型，提升预测准确性。
方法：研究数据源自福建中医药大学附属康复医院2022-07-01/2025-07-01年收治的245例脑卒中后失语症患者，以失语商变化量≥6分为结局指标。研究队列按7∶3的比例随机分为训练集(n=171)和测试集(n=74)。通过递归特征消除法筛选预测因子，采用6种机器学习算法(逻辑回归、随机森林、决策树、支持向量机、高斯朴素贝叶斯、极限梯度提升分类器)构建模型，使用自举法进行内部验证，通过受试者工作特征曲线、校准曲线及沙普利可加性特征解释方法(SHAP)分析评价模型效能。
结果与结论：245例脑卒中后失语症患者的语言功能改善率为69.80%。年龄、女性、教育程度、命名性失语、非流畅性失语、完全性失语、基线中国功能性语言沟通能力测评总分等10项因素被选为预测因子。高斯朴素贝叶斯模型在测试集中表现最优：曲线下面积值为0.71，F1分数为0.83。校准曲线显示预测概率与实际发生率一致性良好(Brier得分=0.19)，沙普利可加性特征解释方法分析显示命名性失语(0.24)、高龄(0.17)、女性(0.08)、基线中国功能性语言沟通能力测评总分(0.08)、非流畅性失语(0.07)为关键风险因素。结果表明，基于机器学习构建的高斯朴素贝叶斯预测模型可有效识别脑卒中后失语症患者出院时语言功能预后风险，为个体化康复干预提供决策支持。
https://orcid.org/0009-0008-9498-0834(黄韵诗)

中国组织工程研究杂志出版内容重点：干细胞；骨髓干细胞；造血干细胞；脂肪干细胞；肿瘤干细胞；胚胎干细胞；脐带脐血干细胞；干细胞诱导；干细胞分化；组织工程

关键词: 脑卒中后失语症, 机器学习, 预后预测, 高斯朴素贝叶斯, 中国功能性语言沟通能力测评

Abstract: BACKGROUND: Most patients with post-stroke aphasia still have basic communication deficits 1 year after onset, highlighting an urgent need for accurate prognostic prediction tools to guide clinical rehabilitation decisions.
OBJECTIVE: To construct a machine learning-based model for predicting language function prognosis at discharge in patients with post-stroke aphasia, aiming to improve prediction accuracy.
METHODS: Clinical data were collected from 245 patients with post-stroke aphasia admitted to the Rehabilitation Hospital Affiliated to Fujian University of Traditional Chinese Medicine from July 1, 2022 to July 1, 2025, with an aphasia quotient change ≥ 6 points as the outcome indicator. The study cohort was randomly divided into training (n=171) and test (n=74) sets in a 7:3 ratio. Predictive factors were screened using recursive feature elimination. Six machine learning algorithms (logistic regression, random forest, decision tree, support vector machine, Gaussian naïve Bayes, and extreme gradient boosting classifier) were used to construct models. Internal validation was performed using the bootstrap method. Model performance was evaluated using receiver operating characteristic curves, calibration curves, and Shapley additive explanations analysis.
RESULTS AND CONCLUSION: The language function improvement rate among the 245 patients with post-stroke aphasia was 69.80%. Ten factors, including age, female sex, education level, anomic aphasia, non-fluent aphasia, global aphasia, and baseline total score of the Chinese functional communication profile, were selected as predictive factors. The Gaussian naïve Bayes model performed best in the test set, with an area under the curve of 0.71 and an F1 score of 0.83. The calibration curve showed good consistency between predicted probabilities and actual outcomes (Brier score=0.19). Shapley additive explanations analysis identified anomic aphasia (0.24), advanced age (0.17), female sex (0.08), baseline total score of the Chinese Functional Communication Profile (0.08), and non-fluent aphasia (0.07) as key risk factors. These findings indicate that the Gaussian naïve Bayes prediction model based on machine learning can effectively identify language functional prognosis risks at discharge in patients with post-stroke aphasia, providing decision support for individualized rehabilitation interventions.

Key words: post-stroke aphasia, machine learning, prognostic prediction, Gaussian na?ve Bayes, Chinese Functional Communication Profile

中图分类号:

黄韵诗, 柴林松, 倪静蕾, 左双, 林冰冰, 黄佳. 构建基于机器学习的脑卒中后失语症患者功能性语言沟通能力预测模型及评价[J]. 中国组织工程研究, 2026, 30(36): 9604-9612.

Huang Yunshi, Chai Linsong, Ni Jinglei, Zuo Shuang, Lin Bingbing, Huang Jia. Development and evaluation of a prediction model for functional language communication outcomes in post-stroke aphasia patients[J]. Chinese Journal of Tissue Engineering Research, 2026, 30(36): 9604-9612.

图/表（结果） 8

2.1 训练集和测试集患者人口统计学和临床特征比较共纳入245例脑卒中后失语症受试者，其中20例受试者缺失出院时失语商分数，进行多重插补后纳入分析。数据集按照7∶3的比例随机分为训练集(n=171)和测试集(n=74)。由表3可知，训练集和测试集在年龄、性别、脑卒中病程等特征上的分布均无统计学差异(P > 0.05)，但是否为流畅型失语特征的分布有统计学差异(P=0.02)。
2.2 试验流程图见图1。

2.3 预测因子选择通过递归特征消除法结合极限梯度提升分类器对全部特征进行筛选，最终确定10个特征子集用于建模。特征重要性分数排序如图2所示，依次为命名性失语症(0.18)、年龄(0.14)、基线中国功能性语言沟通能力测评总分(0.13)、教育程度(0.11)、女性(0.09)、基线改良Barthel指数总分(0.08)、血管风险因子(0.08)、脑卒中病程(0.07)、非流畅型失语(0.07)、完全性失语症(0.05)。

2.4 预测模型的构建基于上述特征子集，分别构建决策树、支持向量机、高斯朴素贝叶斯、逻辑回归、极限梯度提升分类器、随机森林6种模型。各模型在训练集和测试集的受试者工作特征曲线见图3。决策树模型的受试者工作特征曲线表现最佳，但在测试集下降明显，存在一定过拟合。支持向量机、高斯朴素贝叶斯和逻辑回归训练集与测试集的受试者工作特征曲线差距较小，泛化能力较强。综合结果可见，高斯朴素贝叶斯模型在临床预测中性能较好且稳定性较高。

2.5 预测模型的评价
2.5.1 整体性能 6种模型在训练集和测试集上的F1分数、召回率、准确率和精确率见表4。测试集结果显示，各模型整体性能指标接近，F1分数为0.80-0.85，准确率为0.68-0.76，精确率为0.71-0.79，召回率为0.87-0.98。极限梯度提升分类器和高斯朴素贝叶斯模型在F1分数和召回率上略有优势，但差异有限。两两比较结果显示，F1分数、准确率和精确率等主要指标在经假发现率校正后均无统计学差异(P均> 0.05，表5)。仅召回率在随机森林与决策树、随机森林与高斯朴素贝叶斯、决策树与极限梯度提升分类器、高斯朴素贝叶斯与极限梯度提升分类器4组模型间存在统计学显著差异(假发现率校正后P < 0.05)，见图4A。效能分析表明，当前样本量可检出F1差值> 0.02、准确率差值> 0.023、精确率差值> 0.014、召回率差值> 0.032的差异(检验效能80%)，部分模型间的实测最大差异已超过该阈值，整体提示各模型性能相近。

2.5.2 区分度各模型在训练集与测试集的受试者工作特征曲线下面积见表4。测试集验证显示，6种模型的曲线下面积值介于0.68-0.75之间，表现较为稳定。其中，决策树(曲线下面积=0.75)、极限梯度提升分类器(曲线下面积=0.70)、高斯朴素贝叶斯(曲线下面积=0.71)、逻辑回归(曲线下面积=0.70)、随机森林(曲线下面积=0.68)、支持向量机(曲线下面积=0.69)在测试集上的区分效能相近。两两比较结果显示，各模型间曲线下面积差异均无统计学显著性(假发现率校正后P均> 0.05)，最大曲线下面积差值为0.07(决策树与随机森林)，低于最小可检出差异(曲线下面积差值=0.03，检验效能80%)，提示各模型的区分度无显著差异。
2.5.3 预测模型校准度 6种模型在训练集和测试集的观察值与期望值之比、校准截距、校准斜率和Brier得分见表6。在测试集上，各模型的观察值与期望值之比(1.00-1.04)均接近1.00，校准截距和校准斜率接近理想值(0和1)，Brier得分均为0.19，表明模型预测概率与实际发生率较为一致。两两比较结果显示，除Brier得分在随机森林与决策树、决策树与支持向量机、决策树与极致梯度提升分类器、决策树与逻辑回归4组模型间存在统计学显著差异(假发现率校正后 P < 0.05，图4B)外，其余校准度指标在各模型间均无统计学显著差异(假发现率校正后P均> 0.05)。
2.6 临床特征分析由图5可知，高斯朴素贝叶斯的特征重要性排序前5名分别为：命名性失语症(平均SHAP值=0.24)、年龄(平均SHAP值=0.17)、女性(平均SHAP值=0.08)、基线中国功能性语言沟通能力测评总分(平均SHAP值=0.08)、非流畅性失语(平均SHAP值=0.07)。
最终特征子集间的皮尔逊相关系数热力图见图6。基线中国功能性语言沟通能力测评总分与完全性失语症呈中等负相关(r=-0.75)，而与命名性失语症呈中等正相关(r=0.58)。总体而言，部分特征间存在中等程度的相关性，但大多数特征间相关性较低，提示各特征在模型中具有较好的独立性。

参考文献

[1] FEIGIN VL, NORRVING B, MENSAH GA. Global Burden of Stroke. Circ Res. 2017; 120(3):439-448.
[2] EDMONDS LA, MORGAN J. Two-Year Longitudinal Evaluation of Community Aphasia Center Participation on Linguistic, Functional Communication, and Quality of Life Measures Across People With a Range of Aphasia Presentations. Am J Speech Lang Pathol. 2022;31(5S):2378-2394.
[3] PEDERSEN PM, VINTER K, OLSEN TS. Aphasia after stroke: type, severity and prognosis. The Copenhagen aphasia study. Cerebrovasc Dis. 2004;17(1):35-43.
[4] TETNOWSKI JT, TETNOWSKI JA, DAMICO JS. Patterns of Conversation Trouble Source and Repair as Indices of Improved Conversation in Aphasia: A Multiple-Case Study Using Conversation Analysis. Am J Speech Lang Pathol. 2021;30(1S): 326-343.
[5] MADDEN EB, BUSH EJ, OBERMEYER J, et al. Reading and Writing Rehabilitation With Individuals With Aphasia: A Survey of Speech-Language Pathologists’ Clinical Practice and Perspectives. Am J Speech Lang Pathol. 2025;34(6s):3703-3716.
[6] AZIOS JH, ARCHER B, SIMMONS-MACKIE N, et al. Conversation as an Outcome of Aphasia Treatment: A Systematic Scoping Review. Am J Speech Lang Pathol. 2022;31(6):2920-2942.
[7] DOEDENS WJ, METEYARD L. What is Functional Communication? A Theoretical Framework for Real-World Communication Applied to Aphasia Rehabilitation. Neuropsychol Rev. 2022;32(4):937-973.
[8] PITT R, THEODOROS D, HILL AJ, et al. The impact of the telerehabilitation group aphasia intervention and networking programme on communication, participation, and quality of life in people with aphasia. Int J Speech Lang Pathol. 2019;21(5):513-523.
[9] SPIGARELLI M, MACOIR J. Effectiveness of sensorimotor therapy on action naming in post-stroke aphasia: a systematic review. Disabil Rehabil. 2025;47(15): 3753-3772.
[10] FILIPSKA-BLEJDER K, ZIELIŃSKA J, ZIELIŃSKI M, et al. How Does Aphasia Affect Quality of Life? Preliminary Reports. J Clin Med. 2023;12(24):7687.
[11] BUENO-GUERRA N, PROVENCIO M, TARIFA-RODRÍGUEZ A, et al. Impact of post-stroke aphasia on functional communication, quality of life, perception of health and depression: A case-control study. Eur J Neurol. 2024;31(4):e16184.
[12] JÄGER AP, STEELE CJ, DREYER FR, et al. BOLD Long-Range Temporal Correlations Reflect Changes in Language and Depression Across Intensive Aphasia Therapy. Stroke. 2025;56(11):3138-3152.
[13] ZINGELMAN S, WALLACE SJ, KIM J, et al. Is communication key in stroke rehabilitation and recovery? National linked stroke data study. Top Stroke Rehabil. 2024;31(4):325-335.
[14] WALLACE SJ, WORRALL L, ROSE TA, et al. Measuring communication as a core outcome in aphasia trials: Results of the ROMA-2 international core outcome set development meeting. Int J Lang Commun Disord. 2023;58(4):1017-1028.
[15] BULLIER B, CASSOUDESALLE H, VILLAIN M, et al. New factors that affect quality of life in patients with aphasia. Ann Phys Rehabil Med. 2020;63(1):33-37.
[16] EL HACHIOUI H, LINGSMA HF, VAN DE SANDT-KOENDERMAN MW, et al. Long-term prognosis of aphasia after stroke. J Neurol Neurosurg Psychiatry. 2013;84(3):310-315.
[17] NOUWENS F, VISCH-BRINK EG, EL HACHIOUI H, et al. Validation of a prediction model for long-term outcome of aphasia after stroke. BMC Neurol. 2018; 18(1):170.
[18] LEVY DF, ENTRUP JL, SCHNECK SM, et al. Multivariate lesion symptom mapping for predicting trajectories of recovery from aphasia. Brain Commun. 2024;6(1): fcae024.
[19] BILLOT A, LAI S, VARKANITSA M, et al. Multimodal Neural and Behavioral Data Predict Response to Rehabilitation in Chronic Poststroke Aphasia. Stroke. 2022; 53(5):1606-1614.
[20] JEONG S, LEE EJ, KIM YH, et al. Deep Learning Approach Using Diffusion-Weighted Imaging to Estimate the Severity of Aphasia in Stroke Patients. J Stroke. 2022;24(1):108-117.
[21] LI B, DENG S, ZHUO B, et al. Effect of Acupuncture vs Sham Acupuncture on Patients With Poststroke Motor Aphasia: A Randomized Clinical Trial. JAMA Netw Open. 2024;7(1):e2352580.
[22] 钟晓云,巩湘红.失语症患者交际能力评估工具研究现状[J].中国康复, 2025,40(8):490-495.
[23] CHENG X, XIE L, WANG F, et al. Observations about the effects of compulsory rehabilitation for aphasia patients. Int J Clin Exp Med. 2020;8(13):5815-5822.
[24] BRADY MC, KELLY H, GODWIN J, et al. Speech and language therapy for aphasia following stroke. Cochrane Database Syst Rev. 2016;2016(6):CD000425.
[25] WU Q, HU X, WEN X, et al. Clinical study of acupuncture treatment on motor aphasia after stroke. Technol Health Care. 2016;24 Suppl 2:S691-S696.
[26] DENG S, SANG B, LI B, et al. The efficacy and safety of acupuncture combined with language training for motor aphasia after stroke: study protocol for a multicenter randomized sham-controlled trial. Trials. 2022;23(1):540.
[27] BINSON VA, THOMAS S, SUBRAMONIAM M, et al. A Review of Machine Learning Algorithms for Biomedical Applications. Ann Biomed Eng. 2024;52(5):1159-1183.
[28] VLACHAS C, DAMIANOS L, GOUSETIS N, et al. Random forest classification algorithm for medical industry data. SHS Web of Conferences. 2022;139:3008.
[29] YUAN X, XU Q, DU F, et al. Development and validation of a model to predict cognitive impairment in traumatic brain injury patients: a prospective observational study. EClinicalMedicine. 2025;80:103023.
[30] 国家卫生健康委脑卒中防治工程委员会.中国脑卒中防治指导规范[M].北京:人民卫生出版社,2021.
[31] JUNGBLUT M, MAIS C, BINKOFSKI FC, et al. The efficacy of a directed rhythmic-melodic voice training in the treatment of chronic non-fluent aphasia-Behavioral and imaging results. J Neurol. 2022;269(9):5070-5084.
[32] 张通,李胜利,白玉龙,等.卒中后失语临床管理专家共识[J].中国康复理论与实践,2022,28(1):15-23.
[33] WANG R, WEI W, ZHOU J, et al. Clinical assessment and screening of stroke patients with aphasia: a best practice implementation project. JBI Evid Implement. 2022;20(2):144-153.
[34] ZHANG Y, SUN C, XIE S, et al. Minimal important change for the aphasia quotient of the Chinese Western Aphasia Battery. Eur J Phys Rehabil Med. 2025;61(2): 221-228.
[35] REHABILITATION AND RECOVERY OF PEOPLE WITH APHASIA AFTER STROKE (RELEASE) COLLABORATORS. Predictors of Poststroke Aphasia Recovery: A Systematic Review-Informed Individual Participant Data Meta-Analysis. Stroke. 2021;52(5):1778-1787.
[36] LEE S, NA Y, TAE WS, et al. Clinical and neuroimaging factors associated with aphasia severity in stroke patients: diffusion tensor imaging study. Sci Rep. 2020;10(1):12874.
[37] LAHIRI D, DUBEY S, ARDILA A, et al. Determinants of aphasia recovery: exploratory decision tree analysis. Lang Cogn Neurosci. 2020;36(1):25-32.
[38] XU G, WU Y, QU J, et al. Altered Dynamic Functional Network Connectivity in Post-Stroke Aphasia. Ann Clin Transl Neurol. 2026;13(1):97-107.
[39] 焦黛妍,邓海鹏,张若尘,等.脑卒中患者失语症发生的影响因子及预后[J].中国听力语言康复科学杂志,2019,17(5):370-373.
[40] SEO KC, KO JY, KIM TU, et al. Post-stroke Aphasia as a Prognostic Factor for Cognitive and Functional Changes in Patients With Stroke: Ischemic Versus Hemorrhagic. Ann Rehabil Med. 2020;44(3):171-180.
[41] KANG EK, SOHN HM, HAN MK, et al. Subcortical Aphasia After Stroke. Ann Rehabil Med. 2017;41(5):725-733.
[42] FERNANDES A, FRAGA-MAIA H, MASO I, et al. Predictors of functional communication in people with aphasia after stroke. Arq Neuropsiquiatr. 2022; 80(7):681-688.
[43] LEE H, LEE Y, CHOI H, et al. Community Integration and Quality of Life in Aphasia after Stroke. Yonsei Med J. 2015;56(6):1694-1702.
[44] XU M, LIANG X, OU J, et al. Sex Differences in Functional Brain Networks for Language. Cereb Cortex. 2020;30(3):1528-1537.
[45] LI TT, ZHANG PP, ZHANG MC, et al. Meta-analysis and systematic review of the relationship between sex and the risk or incidence of poststroke aphasia and its types. BMC Geriatr. 2024;24(1):220.
[46] KACZKURKIN AN, RAZNAHAN A, SATTERTHWAITE TD. Sex differences in the developing brain: insights from multimodal neuroimaging. Neuropsychopharmacology. 2019;44(1):71-85.
[47] RELEASE COLLABORATORS, BRADY MC, ALI M, et al. Precision rehabilitation for aphasia by patient age, sex, aphasia severity, and time since stroke? A prespecified, systematic review-based, individual participant data, network, subgroup meta-analysis. Int J Stroke. 2022;17(10):1067-1077.
[48] LIU LS, ZHAO JL, HE YL, et al. The 490th case: arthralgia, amenorrhea, aphasia. Zhonghua Nei Ke Za Zhi. 2021;60(12):1189-1192.
[49] SHARMA S, BRILEY PM, WRIGHT HH, et al. Gender differences in aphasia outcomes: evidence from the AphasiaBank. Int J Lang Commun Disord. 2019;54(5):806-813.
[50] FORKEL SJ, THIEBAUT DE SCHOTTEN M, DELL’ACQUA F, et al. Anatomical predictors of aphasia recovery: a tractography study of bilateral perisylvian language networks. Brain. 2014;137(Pt 7):2027-2039.
[51] KIM KA, LEE JS, CHANG WH, et al. Changes in Language Function and Recovery-Related Prognostic Factors in First-Ever Left Hemispheric Ischemic Stroke. Ann Rehabil Med. 2019;43(6):625-634.
[52] SULLIVAN JJ, ZEKELMAN LR, ZHANG F, et al. Directionally encoded color track density imaging in brain tumor patients: A potential application to neuro-oncology surgical planning. Neuroimage Clin. 2023;38:103412.
[53] LWI SJ, HERRON TJ, CURRAN BC, et al. Auditory Comprehension Deficits in Post-stroke Aphasia: Neurologic and Demographic Correlates of Outcome and Recovery. Front Neurol. 2021;12:680248.
[54] GONZÁLEZ-FERNÁNDEZ M, DAVIS C, MOLITORIS JJ, et al. Formal education, socioeconomic status, and the severity of aphasia after stroke. Arch Phys Med Rehabil. 2011;92(11):1809-1813.
[55] OLIVA G, MASINA F, HOSSEINKHANI N, et al. Cognitive reserve in the recovery and rehabilitation of stroke and traumatic brain injury: A systematic review. Clin Neuropsychol. 2025;39(6):1450-1486.
[56] DUCHARME-LALIBERTÉ G, MELLAH S, BOLLER B, et al. More flexible brain activation underlies cognitive reserve in older adults. Neurobiol Aging. 2022; 113:63-72.
[57] MECH EN, KANDHADAI P, FEDERMEIER KD. The last course of coarse coding: Hemispheric similarities in associative and categorical semantic processing. Brain Lang. 2022;229:105123.
[58] HILDESHEIM FE, OPHEY A, ZUMBANSEN A, et al. Predicting Language Function Post-Stroke: A Model-Based Structural Connectivity Approach. Neurorehabil Neural Repair. 2024;38(6):447-459.
[59] 汉语失语症康复治疗专家共识组.汉语失语症康复治疗专家共识[J].中华物理医学与康复杂志,2019,41(3):161-169.

引言

脑卒中后失语症是脑卒中患者常见的致残性并发症，发生率约为30%[1]，以语言理解和表达障碍为主要特征，显著影响患者的日常生活交流和社会功能[2]。研究表明，即使经过急性期恢复，约61%的患者在发病1年后仍存在功能性语言能力的持续缺陷[3]，表现为拨打电话、阅读菜单、参与日常谈话等基本交流活动受限[4-6]，这些功能障碍不仅严重限制了患者的独立生活能力，还导致社会参与度降低、生活满意度下降以及心理健康受损[7-12]。约67%的脑卒中患者表达了改善功能性语言沟通能力的强烈需求[13-14]，凸显了此问题对患者生活质量和社会功能恢复的深远影响[10-15]。
受医疗资源限制和个体化住院康复周期的约束，脑卒中后失语症患者常面临康复时间不足的挑战，导致功能性语言沟通能力恢复受限，加重患者及家庭的心理和经济负担。因此，构建一个能在早期精准预测出院时功能性语言沟通能力恢复水平的评估体系，不仅可为患者及家属提供科学的预后预期，缓解心理焦虑，还能指导临床医师优化康复资源分配，制定个体化治疗方案，从而提升康复效果、降低长期医疗成本，并促进患者重返社会。
现有研究已尝试开发脑卒中后失语症患者沟通功能恢复的预测模型。EL HACHIOUI等[16]基于脑卒中后失语症序贯预后评估队列数据，通过多变量逻辑回归开发了SPEAK-12模型，整合基线语言学特征与临床指标，预测发病12个月后的功能性语言沟通能力，内部验证的受试者工作特征曲线下面积达0.89，显示出较好的预测性能。NOUWENS等[17]在Rotterdam失语症治疗研究3队列中对SPEAK-12模型进行外部验证，判别性能良好(受试者工作特征曲线下面积为0.87)，但校准性能欠佳(α=-1.98，β=0.88)，因此更新为SPEAK-6模型，预测6个月后的沟通能力。尽管这些模型在功能性语言沟通能力预后预测方面取得进展，但核心变量依赖简易语言筛查量表，限制了评估沟通功能的全面性和精确性。此外，其他研究通过整合影像学和行为学数据构建预测语言恢复模型[18-20]，但多聚焦于失语症严重程度或整体语言功能改善，较少关注功能性沟通能力，限制了它在慢性期的临床应用价值。
为克服上述局限性，此次研究采用中国功能性语言沟通能力测评(Chinese functional communication profile，CFCP)作为核心评估工具[21-22]，因它在中文语境下的文化适应性和临床实用性，可全面评估患者日常沟通功能(如对话、阅读)，并已在脑卒中后失语症临床研究中得到验证[21，23-26]。通过收集患者的语言功能指标和临床特征，应用6种常用的机器学习方法(包括逻辑回归、随机森林、决策树、支持向量机、高斯朴素贝叶斯和极致梯度提升分类器)构建预测模型，这些方法的选择基于在医疗预后预测中的优势：逻辑回归提供可解释性，随机森林、极致梯度提升分类器擅于处理不平衡数据和特征选择，支持向量机和高斯朴素贝叶斯计算高效，决策树易于理解[27-28]。通过系统比较模型性能，筛选出最优算法，以精准预测脑卒中后失语症患者的功能性沟通能力预后，为临床决策提供可靠支持。
中国组织工程研究杂志出版内容重点：干细胞；骨髓干细胞；造血干细胞；脂肪干细胞；肿瘤干细胞；胚胎干细胞；脐带脐血干细胞；干细胞诱导；干细胞分化；组织工程

材料方法

1 对象和方法 Subjects and methods
1.1 设计单中心、回顾性队列研究，基于福建中医药大学附属康复医院住院患者的电子病例数据进行分析。
1.2 时间及地点分析2022-07-01/2025-07-01期间福建中医药大学附属康复医院住院脑卒中失语患者数据。
1.3 对象
1.3.1 样本量估算根据研究设计，选取总自变量数为10，参考每事件变量数(events per variable，EPV)5-10倍[29]，预估事件发生率为0.48[17]，训练集比例为0.7，计算得出训练集样本量为104-208例，测试集样本量为45-81例，总样本量需至少149-289例。此次研究纳入245例脑卒中后失语症患者作为研究对象，满足样本量要求。
1.3.2 病例选择回顾性纳入2022-07-01/2025-07-01期间在福建中医药大学附属康复医院住院治疗的245例脑卒中失语患者。此研究经福建中医药大学附属康复医院伦理委员会批准(审批号：2023KY-036-001)，因为使用匿名化历史数据，故豁免知情同意。
诊断标准：参考《中国脑卒中防治指导规范(2021年版)》缺血性脑卒中及出血性脑卒中的诊断标准[30]，并经颅脑CT或MRI确诊。
纳入标准：①符合上述诊断标准；②首次脑卒中，病程 2周至6个月；③年龄30-75岁[31]；④入院时经西方失语症成套测试(Western Aphasia Battery，WAB)评估为失语症，且失语商< 93.8[32]。
排除标准：①原发性失语症或非脑卒中导致的失语症；②由构音等器质性病变所致的言语障碍[32]；③合并脑卒中后严重并发症(如严重呼吸系统感染、下肢深静脉血栓、上消化道出血等)；④合并其他严重疾病(如严重心肺功能不全、癫痫、Ⅲ/Ⅳ期恶性肿瘤)；⑤患有严重精神疾病(如抑郁症等)[33]；⑥基线期相关评估不完整或缺失，包括：西方失语症成套测试、中国功能性语言沟通能力测评、改良Barthel指数(Modified Barthel Index，MBI)。
1.4 方法

1.4.1 一般资料通过电子病例系统回顾性提取数据，由2名研究者独立完成数据收集，遇分歧由第3名研究者裁决。严格遵循纳入和排除标准，收集以下信息：①一般资料：包括年龄、性别、受教育程度、吸烟情况、饮酒情况、运动习惯、高血压史、糖尿病史、冠心病史、高脂血症史、房颤史；②临床特征信息：脑卒中类型、脑卒中病程、语言功能情况、日常生活活动能力等。各变量定义及赋值见表1。

1.4.2 预测模型的构建首先识别数据库中是否存在缺失值，当缺失值≥20%时剔除该变量，其余缺失值采用多重插补(插补5次)处理。异常值识别采用箱线图方法，将位于上下四分位数加减1.5倍四分位距之外的数据视为异常值。若异常值因数据录入错误或测量误差导致，则使用正确数据修正；若非此类错误，则剔除异常值并通过多重插补(插补5次)替换。连续型变量采用最小-最大标准化方法进行归一化至[0，1]区间。有序分类变量直接采用原始整数编码；无序分类变量，采用独热编码(哑变量编码)，并去除基准列以避免完全共线性。
在特征选择阶段，通过递归特征消除法结合极限梯度提升分类器，从全部特征中筛选出10个最重要的特征形成特征子集。基于该子集，分别采用6种机器学习算法构建预测模型：随机森林、决策树、支持向量机、高斯朴素贝叶斯、极致梯度提升分类器、逻辑回归。各模型具体参数见表2。最后在独立测试集上评估模型性能，并绘制受试者工作特征曲线进行评估分析。

原始数据集按照7∶3的比例随机分为训练集和测试集，划分过程中采用以结局类别为分层变量的分层抽样，确保各类

别样本在训练集和测试集中的分布一致。训练集用于特征选择、模型训练和内部验证，测试集作为独立数据集用于最终模型性能评估。

1.4.3 预测模型的评价采用自举法(Bootstrap，1 000次)评估模型稳健性，在训练集抽样建模并在袋外样本上验证，最终通过独立测试集检验泛化能力，计算以下指标：受试者工作特征曲线下面积、F1分数、准确率、召回率、精确率、观察值与期望值之比、校准截距、校准斜率、Brier分数。
1.4.4 临床特征分析采用沙普利可加性特征解释方法(Shapley additive explanations，SHAP)对最终模型的特征重要性进行解释，绘制特征重要性条形图，展示各预测因子对模型输出的贡献度。采用皮尔逊相关系数(Pearson correlation coefficient)计算最终特征子集之间的线性相关性，并绘制相关系数热力图，取值接近于1，相关性越高。
1.5 主要观察指标
1.5.1 临床疗效评价标准根据住院治疗后西方失语症成套测试量表中的失语商分数，评估受试者出院时语言功能改善情况。失语商通过4个子项目计算，改善标准参考最小临床意义变化值(minimal important change，MIC)，失语商变化量的最小临床意义变化值为6.00分[34]。
1.5.2 功能性语言沟通能力采用中国功能性语言沟通能力检测法(CFCP)评估受试者功能性语言沟通能力，该量表将受试者沟通技能分为5个部分，共25个项目，包括听广播、朗读单词、抄写、听写、书写、计算等任务，每项评分0-10分，总分范围0-250分，分数越高表明交流能力越强[21-22]。
1.5.3 模型评估指标 ①区分度：采用受试者工作特征曲线及曲线下面积评估模型区分不同预后的能力，越接近1说明分辨能力越强，0.5为随机猜想水平；②整体性能：F1分数值越接近1，模型预测稳定性越好；③校准度：Brier分数量化预测风险与实际风险差值，数值越小表示校准度越好。
1.6 统计学分析使用SPSS 25.0与Python 3.9.13进行数据分析。计量资料以 x±s或M(QL，Qu)表示，符合正态分布采用t检验，不符合正态分布采用Mann-Whitney U检验进行组间比较。计数资料以n(%)表示，组间比较将采用χ2检验或Fisher精确概率法。以P < 0.05为差异有显著性意义。模型性能比较采用自举法配对检验，对每对模型进行1 000次重采样，计算测试集受试者工作特征曲线下面积差值分布，记录曲线下面积差值(ΔAUC)的均值及95%置信区间，采用双侧检验计算原始P值。多重比较通过Benjamini-Hochberg法校正假发现率(false discovery rate，FDR)。基于自举法获得的曲线下面积差值标准差，通过检验效能分析(1-β=80%，α=0.05)估算当前测试集规模下可检出的最小曲线下面积差异(minimal detectable
difference，MDD)。文章统计学方法已经通过福建中医药大学生物统计学专家审核。

讨论

通过系统比较支持向量机、逻辑回归、极致梯度提升分类器、随机森林、决策树和高斯朴素贝叶斯6种机器学习模型预测脑卒中后失语症功能性语言沟通能力预后的性能，确定高斯朴素贝叶斯模型为最优预测工具。该模型在测试集上展现出较高的F1分数(0.83)、受试者工作特征曲线下面积(0.71)及稳健的泛化能力，优于决策树模型(曲线下面积0.75但存在过拟合)。高斯朴素贝叶斯模型基于特征独立性假设，计算效率高，特别适合中小样本量和临床特征异质性较高的场景，能够有效处理脑卒中后失语症患者的复杂临床数据，其较高的可解释性便于临床医师理解预测结果，助力早期识别预后不良患者，优化康复资源分配，制定个体化治疗方案。此研究将基线中文功能性语言沟通能力测评总分作为核心预测指标，并将命名性失语症、完全性失语症和非流畅型失语症纳入模型，显著提升了功能性沟通能力预测的全面性和精准性。
基线中国功能性语言沟通能力测评总分在特征重要性排序中始终名列前茅，再次验证了初始失语严重程度作为核心预测因子的价值[35]。已有研究一致表明，初始失语症严重程度越高，患者的康复潜力越低，预后相对较差[36-37]，这一现象可能与初始损伤范围和功能受损程度密切相关。初始失语症严重程度通常反映脑部受损区域的广泛性及关键语言中枢的受累情况[36，38]，损伤范围越大，涉及的神经网络和功能区越多，语言功能恢复空间越有限。此外，严重的功能障碍可能降低患者对康复训练的参与度，进一步加剧预后不良的风险。
不同失语症亚型的预后存在显著差异，研究显示命名性失语预后最佳，经皮运动性失语次之，完全性失语最差[39]。虽然已研究探讨了失语症亚型的预后差异，但多基于传统临床观察和统计分析，缺乏对多种失语症亚型联合预测价值的量化评估。该研究发现，命名性失语症、完全性失语症和非流畅型失语症均被纳入最终模型，且特征重要性较高，其中命名性失语的特征重要性最为突出，完全性失语和非流畅性失语也具有中等程度的预测价值。值得注意的是，尽管完全性失语属于非流畅性失语的范畴，但在独热编码下，二者作为独立变量输入模型，能够识别它们各自对预后的独立贡献。因此，早期识别命名性失语症、完全性失语症及非流畅性失语症患者，对于预后评估和康复决策具有重要意义。
基线改良Barthel指数被纳入最终预测因子，显示它对功能性语言沟通能力预后的重要意义。已有研究表明，失语症严重程度与改良Barthel指数显著相关，该指数不仅能反映患者的日常生活自理能力，还与沟通能力的恢复密切相关[40-41]。进一步研究指出，出院时的日常生活活动能力是功能性沟通表现的潜在预测因素[42]，改良Barthel指数也是失语症患者1年和6个月沟通功能预后的有效预测指标[16-17]，这可能是因为较高的日常生活能力有助于患者更积极地参与康复训练，从而提升沟通能力和生活质量。临床上，失语症康复的目标不仅是改善语言障碍，更在于提升整体生活质量[43]，因此将改良Barthel指数纳入预后评估有助于实现更全面的康复目标。
性别是脑卒中后失语症语言康复的重要影响因素，女性患者在恢复中表现出独特优势。研究表明，女性因大脑语言功能双侧化更显著[44]，脑卒中后失语症发病率较高[45]，且在严重脑卒中时灰质损伤更广泛，特别是在语言流畅性恢复方面[46]。然而，女性通过右半球代偿机制表现出更强的恢复潜力，尤其是高龄女性患者在低强度语言治疗后语言功能改善概率更高[47]，可能与雌激素促进神经可塑性及女性更高的社会参与度有关[44，48-49]。
这些发现提示，临床上可通过增强社会支持和针对性干预优化女性患者的康复效果。
年龄、教育程度、脑卒中病程及血管风险因子被模型识别为语言康复的重要影响因素。年轻患者因更高的神经可塑性表现出更显著的语言功能改善[47，50-51]，而老年患者的神经可塑性较低，左半球语言中枢的恢复能力有限，因此老年患者的语言功能恢复可能更依赖右半球或非语言区域(如额叶背外侧皮质)的功能代偿[52]。高等教育有助于急性期听觉理解能力的提升[53-54]，高认知储备的老年患者在语言任务中表现出额外的脑区激活[55-56]，
但对长期恢复速率的影响有限。教育程度可能通过增加认知储备，进而增强非语言认知网络(如执行控制网络)实现语言功能的代偿[53，57]。血管风险因子作为多种慢性疾病的加权指标，是不良预后的独立危险因素，早期识别血管风险因子对于高风险患者的精准康复管理具有重要意义。
与SPEAK-12模型 (曲线下面积=0.89)和SPEAK-6模型(曲线下面积=0.87)相比[16-17]，高斯朴素贝叶斯模型性能略低，可能受以下因素影响：①中国功能性语言沟通能力测评相较简易筛查量表(ScreeLing)测试更全面但预测难度更高；②样本在流畅与非流畅失语症分布上的异质性可能削弱了模型稳定性；③高斯朴素贝叶斯模型假设特征独立，难以捕捉变量间的复杂交互，而SPEAK模型采用的逻辑回归更适合线性关系。
研究存在以下局限性：首先，仅纳入了一些简单易得的临床变量作为预测因子，可能限制了模型的预测能力；其次，样本量相对较小，且数据来源于单中心，尚未进行外部验证，影响模型的泛化性；此外，未将干预措施纳入模型，主要因现有脑卒中后失语症预后预测模型研究中的干预措施并非核心预测因子，仅NORTHSTAR试验的事后分析将治疗组别(重复经颅磁刺激、经颅直流电刺激或假刺激)作为预测变量[58]，但未报告其对模型性能的显著贡献。同时，病例系统记录的治疗信息较为笼统[如“言语训练”，无法溯源治疗剂量和具体内容(言语语言治疗、音乐治疗或传统康复治疗等[32，59])，难以量化并纳入模型，这可能引入潜在偏倚，此外，忽略干预变异性导致模型对不同康复方案的敏感度降低，从而在泛化应用时过估或低估某些患者的预后，尤其在干预强度或类型差异显著的环境中。未来计划开展大样本、多中心、前瞻性队列研究，纳入神经影像学数据和干预措施等更多潜在预测因子，以进一步提升模型性能和预后预测能力，助力实现更精准的个体化康复管理。
综上所述，通过将年龄、脑卒中病程、血管风险因子、女性、教育程度、基线中国功能性语言沟通能力测评总分、基线改良Barthel指数、完全性失语、命名性失语症、非流畅型失语作为预测因子，采用高斯朴素贝叶斯算法构建脑卒中后失语症患者出院时功能性语言沟通能力预测模型，该模型在区分度和泛化能力方面表现优异，经内部验证具有较好的预测效能，可有效识别预后不良的失语症患者，为精准康复管理提供支持。
中国组织工程研究杂志出版内容重点：干细胞；骨髓干细胞；造血干细胞；脂肪干细胞；肿瘤干细胞；胚胎干细胞；脐带脐血干细胞；干细胞诱导；干细胞分化；组织工程

构建基于机器学习的脑卒中后失语症患者功能性语言沟通能力预测模型及评价

Development and evaluation of a prediction model for functional language communication outcomes in post-stroke aphasia patients

PDF

可视化

摘要/Abstract

引用本文

使用本文

图/表（结果） 8

参考文献

相关文章 15

引言

材料方法

讨论

文章快阅

延伸阅读

编辑推荐

Metrics

本文评价

[1]	赖家铭, 宋玉玲, 陈梓曦, 魏镜桓, 蔡浩, 李国权, . 放射性心脏损伤小鼠内皮细胞衰老的诊断标志物筛选及免疫浸润分析[J]. 中国组织工程研究, 2026, 30(6): 1450-1463.
[2]	张倩, 黄东锋. 加权基因共表达网络分析结合机器学习筛选及验证骨关节炎生物标记物[J]. 中国组织工程研究, 2026, 30(5): 1096-1105.
[3]	顾富城, 杨美鑫, 吴伟欣, 蔡玮俊, 钦洋溢, 孙铭一, 孙健, 耿秋东, 李楠, . 龟鹿二仙胶对膝骨关节炎大鼠肠道菌群的影响：机器学习与16S rDNA分析[J]. 中国组织工程研究, 2026, 30(4): 1058-1072.
[4]	刘怡, 卢加荣, 吴建勇. 融合遗传因素的糖尿病预测及影响因素分析[J]. 中国组织工程研究, 2026, 30(36): 9589-9596.
[5]	王槐旌, 郭锦荣, 万东平, 梅其杰, 袁景钊, 徐文飞, 曾超, 郑海军, 袁长深, 段戡. 多种机器学习鉴定抗菌肽作为骨关节炎钠死亡关键治疗靶点：细胞学验证[J]. 中国组织工程研究, 2026, 30(36): 9413-9422.
[6]	曹珊, 王焱皙, 段凯旋, 祁祥, 王昱涵. 消斑通脉方靶向miR-126-3p调控细胞自噬：防治动脉粥样硬化的生物信息学分析[J]. 中国组织工程研究, 2026, 30(35): 9355-9364.
[7]	杨化群, 阿布都艾尼江·阿不力米提, 王法正, 买买提沙吾提阿吉·麦麦提, 李斯密, 穆合塔尔·麦麦提热夏提. WGCNA及机器学习识别骨关节炎软骨细胞自噬和衰老特征基因[J]. 中国组织工程研究, 2026, 30(34): 8889-8898.
[8]	王学成, 赵亮, 魏周斌. 转化生长因子β调控氧化应激参与肺动脉高压的炎症发生[J]. 中国组织工程研究, 2026, 30(31): 8165-8173.
[9]	管昱杰, 赵彬 . 人工智能在脊柱侧弯筛查和诊断中的应用与展望[J]. 中国组织工程研究, 2026, 30(3): 721-730.
[10]	王志鹏, 张晓刚, 张宏伟, 赵希云, 李元贞, 郭成龙, 秦大平, 任真. 机器学习在腰椎间盘突出症患者预后预测模型中应用价值的系统评价[J]. 中国组织工程研究, 2026, 30(3): 740-748.
[11]	赵非凡, 曹玉净. 强直性脊柱炎与银屑病共有基因人工神经网络模型及基于机器学习的挖掘和验证[J]. 中国组织工程研究, 2026, 30(3): 770-784.
[12]	严玉鸽, 王焱皙, 祁祥, 曹珊, 邹小燕, 刘玉娟. 早发性卵巢功能不全颗粒细胞衰老与内质网应激生物标志物的筛选及实验验证[J]. 中国组织工程研究, 2026, 30(28): 7447-7455.
[13]	徐东方, 赵堃, 卢长柱, 王玉阁, 白连杰, 孟凡谋, 王洋, 姚宏波. 阿尔茨海默病中m6A相关铁死亡基因表达与免疫浸润：机器学习和分子生物学验证[J]. 中国组织工程研究, 2026, 30(24): 6421-6432.
[14]	唐岑, 胡万芹. 构建基于子宫内膜自噬相关基因水平的复发性流产诊断模型[J]. 中国组织工程研究, 2026, 30(22): 5728-5738.
[15]	陈飞军, 陈英果, 李征阳, 胡圆, 李芳. 机器学习法预测模型对老年急性脑出血手术预后的预测效能[J]. 中国组织工程研究, 2026, 30(16): 4045-4053.