1.1 设计 基于生物信息学分析椎间盘退变焦亡相关差异表达基因,筛选具有潜在诊断及治疗价值的基因,利用多个数据集进行验证,并采用细胞实验进行体外实验验证。统计分析根据数据类型不同采用不同方法,主要结果以正常髓核细胞和退变髓核细胞比较为主。
1.2 时间及地点 实验于2022年7-8月在上海昆盟生物科技有限公司细胞实验室完成。
1.3 材料 从Procell(中国湖北)购买健康人髓核细胞(CP-H097)和椎间盘退变人髓核细胞(CP-H170),进行细胞培养。此次研究通过上海中医药大学伦理委员会审查,伦理编号:PZSHUTCM221010002。
1.4 方法
1.4.1 数据采集 下载椎间盘退变的基因表达谱数据GSE124272[10]、GSE150408[11],从GEO数据库[12],使用GEOquery包[13]。GSE124272数据集来自智人,数据平台是GPL21185,总共包含16个样本,包括8个对照(control)和8个疾病样本(disease),所有样本均纳入此次研究。GSE150408 数据集来自智人,数据平台是 GPL21185,它总共包含59个样本,包括17个对照和42个疾病样本,其中25个疾病样本已用药物治疗,17个疾病样本未用药物治疗。为了排除药物对研究的干扰,纳入了17个对照组和17个未经药物治疗疾病组。见表1。
1.4.2 差异表达基因分析 为了分析基因表达值对疾病组相对于健康对照组的影响,根据分组信息采用R包limma进行差异分析[14]。将P值< 0.05的基因设置为差异表达基因,差异分析的结果显示在热点图和火山图中。其中热图使用R的ggplot2包绘制。
1.4.3 焦亡相关基因差异表达基因的分析 先前的文献报道的33个焦亡基因[15],将GSE124272数据集的差异表达基因与焦亡基因集取交集,得到差异表达的焦亡相关基因。使用在线工具维恩图进行可视化。
1.4.4 焦亡相关基因功能及通路富集分析 基因本体论分析是对基因进行大规模功能富集研究的常用方法[16],包括其中包括生物学过程、分子功能和细胞组分。KEGG是一个广泛使用的数据库[17],用于存储有关基因组、生物途径、疾病和药物的信息。采用R软件包clusterProfiler对椎间盘退变相关差异表达基因进行基因本体论功能注释分析和KEGG通路富集分析[18]。在这项研究中,P值< 0.05被认为有统计学意义。
1.4.5 基因集富集分析 由于常规富集分析(基因本体论、KEGG)侧重于比较两组间的基因表达差异,集中关注少数显著上调或下调的基因,可能导致忽视一些关键信息,因此需要其他的富集方法进行补充。基因集富集分析可检测出不显著但是一致的差异表达趋势的基因集,同时为了研究不同分组之间生物过程的差异,使用基于椎间盘退变患者基因表达谱数据集进行了基因集富集分析[15]。基因集富集分析是一种计算方法,用于分析特定基因集在2种生物学状态之间是否具有统计学差异,通常用于估计表达数据集样本中途径和生物过程活性的变化。从MSigDB数据库下载了“c2.cp.kegg.v6.2.-symbols”基因集用于基因集富集分析[19],false discovery rate (FDR) < 0.25被认为显著富集。
1.4.6 免疫浸润分析 CIBERSORT是基于线性支持向量回归的原理对转录组表达矩阵进行反卷积[20],从而在混合的细胞中估算出免疫细胞的组成和丰度。将基因表达矩阵数据上传到CIBERSORTx(https://cibersortx.stanford.edu/),结合LM22 特征基因矩阵,过滤输出P < 0.05的样本,得出免疫细胞浸润丰度值。使用R语言“ggplot2”包绘制柱状图展示22种免疫细胞浸润在每个样本中的分布。然后将差异表达的细胞焦亡相关基因与免疫细胞进行相关性分析。
1.4.7 构建蛋白质-蛋白质相互作用网络 STRING数据库是一个用于搜索已知和预测蛋白质相互作用的数据库[21],其中包括2 031个物种,960万个蛋白质和138万个蛋白质-蛋白质相互作用。使用STRING数据库构建蛋白-蛋白相互作用网络,并将参数设置为:系数0.4。蛋白质-蛋白质相互作用结果从STRING数据库导出并由Cytoscape可视化[21]。此外,采用CytoHubba插件来分析基因集富集分析网络中的Hub基因[22]。
1.4.8 椎间盘退变生物标记物的鉴定 分析与椎间盘变性相关的差异表达焦亡基因,并使用GSE150408数据集验证了差异表达焦亡基因的表达。使用R包pROC绘制差异表达焦亡基因的ROC曲线[23],并计算曲线下
面积。
1.4.9 细胞培养 为了验证生物信息学分析所得椎间盘退变焦亡相关Hub基因及NLRP3在椎间盘退变中是否存在表达差异,进行基础实验。由于椎间盘最主要的结构为髓核组织,故从Procell(中国湖北)购买健康人髓核细胞(CP-H097)和椎间盘退变人髓核细胞(CP-H170),并在DMEM中培养,每三四天换液,培养基包括体积分数10% 胎牛血清和1%青霉素及链霉素。细胞在37 ℃和体积分数5%CO2中培养,原代细胞贴壁后7-
14 d长满皿底,随后进行传代,实验选取传代3代以内的细胞。
1.4.10 RNA分离和实时定量聚合酶链反应(qRT-PCR) Trizol(TaKaRa,东京,日本)提取总RNA,使用SuperScriptTM Ⅱ反转录酶试剂盒(TaKaRa,东京,日本)反转录为cDNA。使用SYBR Premix Ex Taq进行qRT-PCR检测(TaKaRa Bio,Inc,日本大津)。变性、退火和延伸的条件如下:95 ℃,30 s,95 ℃,5 s 45次循环,60 ℃,20 s。通过2 ΔΔCt法分析相对基因水平,并通过GAPDH进行归一化。引物如下:
IL-1β为5′-CCA GGG ACA GGA TAG AGC-3ʹ(正向引物)和5′-TTC AAC AGG AGG AGG TAC AG-3ʹ(反向引物);
NLRP3为5′-GAT CTT CGC TGC GAT CAC A-3ʹ(正向引物)和5ʹ-GGG ATT CGA AAC ACG TGC ATT A-3ʹ(反向引物);
Caspase-1为5ʹ-GCC TGT TCC TGT GAT GGA G-3ʹ(正向引物)和5ʹ-TGC CCA CAG ACA TTC ATA CAG TTT C-3ʹ(反向引物);
AIM2为5ʹ-TGT GGA GGT CAC CAG TTC CT-3 ʹ(正向引物)和5ʹ-ACC TCC ATG GCC TCT T-3 ʹ(反向引物);
Caspase-5为5′-TAG ACT CTG CGA AAG AAT CGC GTG GCT CAT CAT-3′(正向引物)和5′-CAC CTC TGC AGG CCT GGA CAA TGA TGA C-3′(反向引物);
NLRC4为5′-TTG AAG GCG AGT GGC AAA G-3′(正向引物)和5′-GGC GCT TCT CAG GTG GAT G-3′(反向引物);
内部参考对照的是人GAPDH,5’-CCT GCA CCA CCA CCA ACT GCT TA-3’(正向引物),5ʹ-GGC CAT CCA CAG TCT TCT GAG-3’(反向引物)。
1.5 主要观察指标 qRT-PCR检测各组髓核细胞焦亡相关基因(IL1-β、Caspase-1、AIM2、Caspase-5、NLRC4、NLRP3)的表达差异。
1.6 统计学分析 所有数据计算和统计分析均使用 R 编程(https://www.r-projec t.org/,版本 4.0.2)执行。对于两组连续变量的比较,采用独立Student t检验估计正态分布变量的统计显著性,采用Mann-Whitney U检验(即Wilcoxon秩和检验)分析非正态分布变量之间的差异。使用R的pROC包绘制ROC曲线,并计算曲线下面积。所有统计P值均为双侧,P < 0.05为差异有显著性意义。文章统计学方法已经上海中医药大学生物统计学专家审核。