1 资料和方法 Data and methods
1.1 检索方法 在GEO数据库(https://www.ncbi.nlm.nih. gov/geo/)检索;检索词为“intervertebral disc”“human”“long noncoding RNA”;检索时间范围在2009年1月至2018年12月。
1.2 数据下载 根据检索结果从GEODatasets下载芯片GSE56081(平台GPL15314,Agilent_033010探针,Arraystar人lncRNA微阵列V2.0) [9]。lncRNA微阵列数据集中纳入了10份样本,其中5份为人正常髓核,5份为人退变椎间盘髓核。下载芯片中的系列矩阵文件和平台文件。
1.3 重注释比对 将GEO平台文件中的探针核酸序列整理为fasta格式[10]。在Gencode平台(https://www. gencodegenes. org/)下载人类染色体上所有转录物的核苷酸序列文件,运用生信人工具盒(版本v1.0.8)SeqMap序列比对工具,将探针核酸序列与人类染色体上所有转录物的核苷酸序列文件进行比对,得到含有基因名的探针文件。
1.4 系列矩阵注释 运用Perl软件(版本5.24.3)将系列矩阵文件与探针文件比对,将系列矩阵文件中的探针ID转化为基因名。在Gencode平台下载人类基因组注释GTF文件,通过Perl软件在系列矩阵文件中添加基因属性,以此区分mRNA和lncRNA。
1.5 差异分析 运用R软件(版本3.5.1)的limma包分析系列矩阵文件中的差异基因,以logFC(log2 fold change,log2差异倍数) >1或者< -1,并且校正后P < 0.05为筛选参数,得到差异的lncRNA与mRNA(芯片数据中有一部分为mRNA),绘制差异表达的lncRNA的分层聚类树形图和热图。logFC大于0代表此差异lncRNA在退变椎间盘组中上调,反之则为下调。
1.6 预测lncRNA结合的miRNA 在miRcode平台(http://www.mircode.org/)下载高度保守的miRNA家族文件。运用Perl软件比对差异lncRNA与miRNA相互作用关系,预测得到lncRNA-miRNA关联。
1.7 预测miRNA调控的mRNA 根据miRDB数据库 (http://mirdb.org/)、miRTarBase数据库(http://mirtarbase. mbc.nctu. edu.tw/php/index.php)和TargetScan数据库(http://www.targetscan.org/vert_72/)预测miRNA调控的mRNA,只有上述3个数据库均预测得到的mRNA才被纳入研究。运用Perl软件将miRNA预测的mRNA与芯片数据中的差异mRNA取交集,最后得出miRNA-mRNA关联。
1.8 ceRNA网络构建 运用Cytoscape软件(版本3.7.0)分别构建上调和下调差异表达lncRNA的ceRNA网络,连线代表节点之间存在调控关系。
1.9 蛋白互作网络构建与模块分析 运用String数据库(版本10.5,https://string-db.org/)分析ceRNA网络中mRNA编码的蛋白质,设定置信度得分>0.9为筛选参数,分析蛋白互作关系[11]。使用Cytoscape软件绘制蛋白互作网络,并运用MCODE插件筛选蛋白互作网络中的模块,以度值=2,节点得分=0.2,k-core=2,最大深度=100作为筛选参数,筛选关键蛋白互作模块。
1.10 GO富集分析与KEGG富集分析 运用DAVID数据库(版本6.8,https://david.ncifcrf.gov/home.jsp)做GO富集分析关键蛋白互作模块的功能,做KEGG富集分析相关通路,P < 0.05代表富集结果显著[12],采用WPS软件(版本11.1)Excel表格绘制GO富集分析图。
1.11 挖掘关键ceRNA网络 挖掘KEGG富集分析中各条通路富集基因的mRNA在ceRNA网络中的关联信息,分析lncRNA与mRNA竞争结合的miRNA,并运用Cytoscape软件绘制关键ceRNA网络。