1.1 设计 影像组学试验,计量资料经Shapiro Wilk检验,满足正态分布,组间比较采用独立样本t检验;定性资料采用频数描述数据分布,组间比较采用卡方检验。
1.2 时间及地点 试验于2021年3-12月在中国中医科学院望京医院完成。
1.3 对象 通过招募广告和中国中医科学院望京医院脊柱二科门诊纳入青年颈椎C4/5失稳受试者56例和非失稳受试者55例,进行核磁图像采集。
所有受试者对研究方案均知情同意,并签署知情同意书。试验经由中国中医科学院望京医院伦理委员会批准(批准号:WJEC-KT-2021-001-P002)。
纳入标准:年龄18-45岁,不限性别。颈椎失稳受试者标准:①符合颈椎失稳诊断标准——White标准[9]:X射线侧位片或过伸位片或过屈位片出现椎体水平位移≥ 3.5 mm或椎体角度位移≥11°;②仅C4/5节段出现失稳。颈椎非失稳受试者标准:X射线侧位片、过伸位片及过屈位片椎体水平位移< 3.5 mm且椎体角度位移< 11°。受试者自愿参加此次研究。
排除标准:①因先天发育、创伤、肿瘤、结核、类风湿等疾病所致的颈椎失稳者;②颈椎退变严重者,例如颈椎椎体出现明显骨赘、椎间隙明显狭窄、韧带出现骨化(前纵韧带、后纵韧带等)等;③脊柱感染、创伤骨折、肿瘤、结核、重度骨质疏松、强直性脊柱炎等;④无法接受MRI检查者,例如幽闭恐惧症、体内有铁磁性植入物、心脏起搏器等;⑤妊娠、哺乳期妇女或备孕、盲、聋、哑、智力或精神障碍等特殊人群。
1.4 方法
1.4.1 影像资料采集 采用3.0-T核磁设备(德国SIEMENS),脊柱线圈,各项同性扫描,扫描序列为:T2-SPACE-TRA序列,TR/TE=1 500 ms/106 ms,翻转角度60°,矩阵512×512,层厚2.5 mm,层间距0.2 mm,激励次数1.4次,以颈椎C4椎体后缘的中点为中心,共扫描40层。MRI图像以DICOM格式保存,见图1。
1.4.2 感兴趣区域(region of interest,ROI)分割 在椎间盘所在的横断面图层,课题组选择受试者所对应的椎间盘区、关节突区、椎前肌区(主要为颈长肌)、颈后肌群深层区(主要为颈半棘肌)和颈后肌群浅层区(除颈半棘肌以外,可在MRI图像下被明显识别的颈后侧肌肉群:头半棘肌、头夹肌、颈夹肌、肩胛提肌、中后斜角肌等)等5个特定ROI进行手动分割。为尽可能满足分割的准确性,先由一名课题组成员进行分割,再由一名工作经验丰富的脊柱科和影像科医生分别对分割结果进行验证和修正。为尽可能勾画颈部各个结构最实性的部分,排除周围其他组织的不确定性影响,课题组严格按照颈部的解剖结构,采用最小轮廓法进行勾画[10-12]。ROI分割见图2。
1.4.3 特征提取 通过基于Python 3.7环境中的Pyradiomics工具完成各ROI域的自动匹配并提取影像组学特征。基于研究目的,对失稳患者的失稳节段和非失稳者所对应的同一节段特征进行提取对比以探究两个人群之间的差异,同时提取失稳节段的邻近节段特征与失稳节段进行对比以消除自身退变因素的影响。提取特征类型包括一阶统计量特征、空间几何特征、纹理特征、变换特征等4类特征。
1.4.4 特征筛选 将提取出的影像组学特征应用MinMaxScaler进行数据归一化后,首先应用anova_f-test进行初步特征筛选,在试验中保留前5%差异性最大的特征,后针对各个具体的模型进一步使用递归特征消除法筛选特征,最终获得该模型评价指标最高的特征子集。
1.4.5 模型构建 在模型训练前,首先进行超参数调优,对模型超参数进行网格搜索以寻找最优超参数值组合[13]。后将筛选得到的特征分别应用于支持向量机、LightGBM、RandomForest、Logistic、AdaBoost、LinearDiscriminantAnalysis
等6种机器学习算法中,以进行训练来构建颈椎失稳的分类诊断模型。为了确保测试集与训练集的数据相互独立,以避免“信息泄露”而影响试验结果的可靠性,此次研究采用十折交叉验证方法。
1.5 主要观察指标 采用f1-macro、精确率-macro、召回率-macro、曲线下面积、受试者工作特征(receiver operating characteristic,ROC)曲线等评价模型。
1.6 统计学分析 采用SPSS 20.0软件对所得数据进行统计学分析。此次研究中,计量资料经Shapiro Wilk检验,满足正态分布,采用x±s描述数据分布,组间比较采用独立样本t检验;定性资料采用频数描述数据分布,组间比较采用卡方检验。以P < 0.05为差异有显著性意义。
机器学习模型的诊断分类效能通过ROC曲线表现,计算各个模型的十折交叉验证平均曲线下面积值、平均精确率-macro、平均召回率-macro、平均f1-macro。以平均曲线下面积为主要参考指标评估每个模型的诊断分类能力,平均曲线下面积在0.50-0.70之间为准确性一般,平均曲线下面积在0.71-0.90之间为具有一定的准确性,平均曲线下面积在0.90以上为具有较高的准确性。