ixxmu / mp_duty

抓取网络文章到github issues保存

Home Page:https://archives.duty-machine.now.sh/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

7+非肿瘤纯生信,昼夜节律基因在阿尔兹海默症中的研究。非肿瘤中也运用了百种机器学习建模,内容丰富!

ixxmu opened this issue · comments

7+非肿瘤纯生信,昼夜节律基因在阿尔兹海默症中的研究。非肿瘤中也运用了百种机器学习建模,内容丰富! by 生信小课堂

影响因子:7.3

研究概述:

昼夜节律紊乱(CRD)是阿尔茨海默病(AD)发病机制的关键因素,本研究旨在阐明CRD如何在AD免疫微环境中发挥作用。作者利用昼夜节律评分(CRscore)量化来自AD的单细胞RNA测序数据集中昼夜节律紊乱的微环境状态,每种免疫细胞类型亚群中不同水平的CRscore与不同的免疫特征,细胞间通讯,代谢途径和转录特征密切相关。最后应用基于机器学习的整合模型,构建CRD特征,并采用RT-PCR分析验证其表达水平。

研究流程图:

关于非肿瘤生信,我们也解读过很多,主要有以下类型
1 单个疾病WGCNA+PPI分析筛选hub基因
2 单个疾病结合免疫浸润,热点基因集,机器学习算法等
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
4 基于分型的非肿瘤生信分析
5 单细胞结合普通转录组生信分析

目前非肿瘤生信发文的门槛较低,有需要的朋友欢迎添加小编微信咨询

生信分析咨询

请扫描下方二维码

研究结果:

一、AD免疫微环境中基于CRD的单细胞转录图谱

1. 作者最初使用Seurat方法重新分析了先前发表的scRNA-seq数据集(GSE181279,包括2个正常和3个AD外周血样本)。经过质量控制过滤,从5个样本的36725个细胞**获得18400个独特基因(图2A)。

2. 在对基因表达进行归一化后,作者使用基于UMAP的聚类,并根据高度可变的基因确定了总共12个不同的细胞簇。根据多种细胞标记划分为可识别的细胞类型:CD4+ T细胞、CD8+ T细胞、NK细胞、B细胞、骨髓细胞和巨核细胞 (图2B、C)。

3. 图2D显示了每个样品中不同细胞类型的比例,AD患者中CD4+ T细胞、CD8+ T细胞、B细胞和巨核细胞丰富。图2E显示了每种细胞亚型中前20个特征基因的表达图谱,表明这些独特的标记物可以精确地区分细胞亚型。

4.将2091个CRG与1098个AD相关DEGs交叉,最终确定了201个差异表达的CRGs。在STRING数据库的基础上进行交互分析,预测它们之间的关系,并基于功能注释分析确定相应的子网或邻域。通路富集分析显示,这些差异表达的CRGs主要影响细胞因子受体相互作用、cAMP信号通路、FoxO信号通路、昼夜节律、内质网抗原加工和递呈以及蛋白质加工(图2F)。

5. 随后关注AD样本来源细胞与CRD之间的关系。采用评分算法量化AD细胞中的CRscore。如图2G和S1C所示,各细胞簇的CRscore明显更高。与其他细胞亚型相比,B细胞的CRscore更高,即更强的昼夜节律CR。图S1D根据CRscore将AD细胞分为高低两组,9个周期蛋白相关基因(CCNC、CCND2、CCND3、CCNH、CCNI、CCNK、CCNL1、CCNL2和CCNT1)在低CR的AD细胞中显著上调(图S1E),表明低CR组细胞周期激活显著。

图S1:单细胞水平上的CRD特征

二、AD中基于CRscore的B细胞亚群的单细胞RNA测序

1. 作者从AD样本中提取2811个B细胞进行亚聚类分析,鉴定出7个不同的细胞簇(图3A),进一步细分为4个B细胞亚组:幼稚B细胞,记忆B细胞,干扰素刺激基因(ISG+) B细胞和生发中心(GC) B细胞(图3B)。B细胞亚群的平均数量和细胞比例在高低CR组之间有相当大的差异(图3C)。

2. 图3D显示了每种细胞类型中前30个特征基因和标记基因的表达景观,表明这四个B细胞亚群的表达明显不同。除了蛋白质输出和MMPs外,高CR组的抗原呈递和表面标记物的表达明显高于低CR组,而低CR组的促炎和趋化因子受体的表达明显高于高CR组(图3E)。

3. 基于CellPhoneDB的细胞-细胞结合分析显示,高CR组的GC B细胞经常通过CD40LG_CD40和CD70_CD27等配体受体对,与其他3种B细胞相互作用。同时,高CR组的记忆B细胞通过HLA-F_LILRB1、CD70_CD27、APP_SORL1与GC B细胞相互作用(图3F)。

4. 图3G进行了SCENIC 分析,以确定转录因子(TFs)从低CR到高CR的变化。高CR组表现出多数为活化的TFs,并抑制少数TFs:BHLHE41和E2F6,表明CRD与AD患者的TF失调密切相关。

5. 进行GSVA以评估不同CR水平AD患者之间生物学功能的差异,检测到代谢过程、线粒体电子传递、核糖体组装、泛素蛋白连接酶活性和细胞分裂的负调控是高CR组的富集特征(图3H)。利用代谢途径富集分析进一步比较表明,高CR组中与抗坏血酸和醛酸盐、鞘糖脂生物合成、其他聚糖降解、色氨酸、β-丙氨酸、甘油磷脂、磷酸戊糖和谷氨酸相关的代谢过程显著上调(下图S2A)。

6. 伪时序分析描述了不同B细胞分化的时间序列。幼稚B细胞主要定位于分化途径的起点,而GC B细胞普遍存在于分化途径的末端(上图3I)。这些发现表明,幼稚的B细胞可以转化为GC B细胞。下图S2B观察到此过程中:表面标志物,趋化因子受体和蛋白质输出相关基因发生了显著改变。

三、AD中基于CRscore的CD4+ T细胞表现出不同的分子特征

1. 根据UMAP分析确定AD中CD4+ T细胞簇的6个亚组(图4A)。根据已知的标记物(ANXA1、ANXA2、CCR7、LEF1、TCF7、SELL、CCL5、GZMK和GZMA)将CD4+ T细胞分为3个亚组,包括CD4_C01_ANXA1、CD4_C02_CCR7和CD4_C03_CCL5 (图4B)。高低CR组之间每个亚组的相应丰度存在差异(图4C)。

2. 图4D描绘了亚组标记基因和每个亚组的前30个差异表达基因。

CD4_C01_ANXA1被分配到中枢记忆CD4+ T细胞,其特征是ANXA1和ANXA2的表达;

CD4_C02_CCR7高表达的初始标记物(CCR7、SELL、TCF7和LEF1)代表初始CD4+T细胞。

CD4_C03_CCL5细胞毒效应因子(GZMK、GZMA、CCL5)表达增加,表明它们与细胞毒效应因子CD4+ T细胞密切相关。

3. 使用CellPhoneDB比较组间CD4+ T细胞亚群的细胞间相互作用。从CD4_C01_ANXA1和CD4_C02_CCR7细胞到CD4_C03_CCL5细胞的低CR组中,APP_CD74、COPA_CD74、MIF_CD74和SIRPG_CD47等多个配体受体对具有活性(图4E)。

4. 图4F的PROGENy分析显示,低CR组在14个经典疾病进展相关通路中的11个中表现出显著上调,表明CD4+ T细胞中低水平的CRscore似乎与AD进展更密切相关。

5. 图4G显示低CR组中,与抗原呈递(HLA-A、HLA-B、HLA-DPA1、HLA-DQA1、HLA-DQB1、HLA-DQB2、MICA和MICB)、表面标记物(MS4A1、CD22、CD52、CD74、CD83、CD63、TNFRSF17、TNFRSF18和SEC61B)、趋化因子受体(IL4R、CXCR4、CXCR5、CCR6和CCR10)和蛋白质输出(SEC61B、SPCS2、SPCS3和SEC11C)相关的大多数基因的表达均有所增加。

6. 图S3A 的GSVA显示,低CR组主要参与昼夜节律减弱,细胞稳态,巨噬细胞迁移,RNA迁移和toll样受体2信号通路。随后作者进一步全面评估了具有不同CRscore水平的CD4 T细胞之间代谢途径的差异,在85个代谢途径中,有44个在低CR组和高CR组之间有显著差异。具有低CRscore的CD4 T细胞富含更多的代谢途径和基因(图4H,I)。

7. 作者进行SCENIC 分析以估计CD4+ T细胞分化过程中CRD的上游TFs:低CR组的相关TF为CR1D1、RELB、PRDM1、CREM、RORC、KLF10、NR3C1、BHLHE40、FOSB、NFKB2、ATF3、CEBPD、JUN、DDIT3、ELF1、IRF1、JUNB、FLI1、ETV7、YY1、FOS、STAT1、JUND、KLF6和SPIB。据报道,作为cAMP响应元件的调节剂,JUNB和CREM有抑制CD4调节性T细胞的功能(图4J)。

8. 使用Monocle 3方法交叉证实CD4+ T细胞群是由在分化过程中处于不同阶段的细胞分组组成的:分化状态起初在CD4_C02_CCR7簇周围发生变化,而CD4_C03_CCL5位于发育阶段的末端(图4K)。在分化起始阶段的基础上,几种表面标志物(CR2、CD63、CD40、CD37、CD27和CD38)和CCR7降低,而其他表面标志物(MS4A1、CD63和TNFRSF18)、趋化因子受体(CXCR4、CXCR5和CCR6)和蛋白输出基因(SEC61B、SPCS1、SPCS2和SPCS3)在分化过程中增加(上图S3B)。

四、AD中基于CRscore的CD8+ T 细胞显示出信号传导、细胞间通讯和分化失调

1. 为阐明CD8+ T细胞之间的异质性,使用UMAP分析将5250个CD8+ T细胞重新聚集成7个簇(图5A),在图5B中进一步分为CD8_C01_CCR7 (幼稚细胞)、CD8_C02_GNLY (TEMRA细胞)、CD8_C03_GZMK(细胞毒性效应细胞)和CD8_C04_SLC4A10 (MAIT细胞)。与高CR组的样本相比,这四种亚型的数量在低CR组中下降(图5C)。

2. 图5D描述了每个集群的前30个差异表达基因。高低CR组之间CD8+ T细胞亚群的细胞-细胞相互作用分析表明,低CR组显示:从CD8_C01_CCR7细胞到其他亚型,APP_CD74、APP_SORL1、COPA_CD74、HLA-E_KLRC1、LGALS9_SORL1、SELL_SELPLG、TNFSF10_RIPK1和TYROBP_CD44配体受体对的活性增加。

3. 低CR组中CCL4L2_PGRMC2、CD58_CD2、TNFSF12_TNFRSF25和TNFSF14_TNFRSF14的富集证明了CD8_C04_SLC4A10在募集其他三个亚群中的潜在作用(图5E)。

4. PROGENy分析表明,经典的致病通路(NFkB、TNFα、雄激素、EGFR、p53、缺氧、MAPK和TGFβ)在低CR组显著富集,而高CR组与PI3K,WNT,雌激素,JAK-STA和VEGF信号通路的激活密切相关(图5F)。此外,除了蛋白质输出基因外,与抗原呈递、表面标记、趋化因子受体、促炎和MMPS相关的大多数标记基因的表达都在低CR组中得到增强(图5G)。

5. 对85条代谢途径的富集分析显示,有27条代谢途径在高低CR组之间明显不同,高CR组有13条代谢途径被激活,低CR组有14条代谢途径被抑制(图5H)。与此一致的是,低CR组也集中于更多的代谢基因(图5I)。

6. 图5J采用SCENIC分析来检测各组间TF的差异:45种失调TFs中有24种在低CR组中富集。图5K弥散图伪时间中,CD8_C01_CCR7细胞主要位于最未分化状态,CD8_C02_GNLY和CD8_C03_GZMK细胞位于CD8_C01_CCR7簇的明显下游轨迹,CD8_C04_SLC4A10位于最后分化阶段。

7. 图S4A进行GSVA以阐明两组之间的分子特征差异:高CR组表现出免疫应答,免疫细胞分化,线粒体电子转运和神经炎症反应的增加,而低CR组主要受神经元凋亡过程、中性粒细胞、肥大细胞和髓细胞的激活以及脂氧合酶途径的调节。

8. CD8+ T细胞亚群分化过程中,基因表达分布模式存在显著差异:表面标志物CD27和趋化因子受体(CXCR5和CCR6以及CCR7)在伪时间过程中以未分化状态突出表达,而其他表面标志物(CD52,CD40,CD37,CD38,CD63和TNFRSF18)和蛋白质输出标志物(SEC61B,SPCS1,SPCS2和SPCS3)在CD8 T细胞分化阶段减少(图S4B)。

五、使用bulk转录组学数据集验证CRscore的有效性和稳健性

1. 由于涉及scRNA-seq数据集的样本不足,因此作者收集了几个与AD相关的独立基因表达数据集来验证CRscore的性能。在GSE106241数据集中,根据CRscore的中位数将AD样本分为高低两组,图6A显示低CR组和高CR组之间1387个上调和1217个下调DEGs的表达模式。在这些情况下,高CR组的样本的CRscore明显高于低CR组(图6B)。

2. 在低CR组中观察到更多的晚期AD患者,而年龄和性别的分布没有统计学差异(图6C)。此外,相对于高CR组,低CR组的CRscore表现出几种典型AD相关病理标志物的活性增加,包括包括Aβ42,α分泌酶,β分泌酶和γ分泌酶(图6D-G)。

3. 在12条经典致病通路中,低CR组主要负责激活TGFβ,JAK-STAT,p53,VEGF,TNFα,雄激素,NFkB和EGFR信号通路(图6H)。

4. 在GSE84422和GSE48350的联合数据集中,高低CR组也表现出明显不同的基因表达模式和两组之间的CRscore分布(图6I, J)。同样,低CR组患者属于V+VI期的比例也高于高CR组 (图6K)。此外,在组合数据集的低风险组中也可以观察到与GSE106241数据集相似的致病途径的激活(图6L)。这些发现表明,基于差异表达的昼夜节律基因特征的CRscore算法可以在bulk转录组数据集中准确定义AD患者的CR活性。

5. 使用CMap数据库研究了低CR和高CR患者的前瞻性治疗药物,以评估AD患者的个体化临床治疗。X4-5-二苯胺基邻苯二甲酰亚胺、法舒地尔、PHA-00816795、TTNPB和MK-886是低CR组具有个性化治疗潜力的前五种药物(图6M)。而RRNPB、NU-1025、花生四烯基三氟甲烷、exisulind和MS-275是高CR评分AD患者的五种最有效的治疗药物(图6N)。具体而言,MK-866和MS-275分别在低和高CR组中具有最低的CMap评分,在CR评分不同的AD患者中显示出最大的治疗益处。

六、CRD涉及AD免疫微环境的改变

1. 作者在合并数据集的AD样本中使用ssGSEA、MCPcounter、xCell、ABIS和ESTIMATE算法评估了CRD水平与免疫细胞浸润之间的关系,发现低CR患者的免疫细胞亚群浸润水平明显高于高CR患者,证实在ssGSEA、MCPcounter、xCell和ABIS算法中,大多数免疫细胞在低评分组明显丰富(图7A)。同时,包括CCL5和CCL20在内的几种免疫趋化因子在低CR条件下升高,并被证实在调节性T细胞的积累中发挥关键作用。

2. 在低CR患者中,MHC-I、MHC-II、免疫抑制剂、免疫刺激剂、趋化因子和趋化因子受体普遍升高,而在高CR患者中,HLA-DOB、KIR2DL1、PVR、CXCL14、CXCL12、CX3CL1和CCL1的表达水平较高(图7B)。

3. 另一方面,低CRscore患者的免疫评分水平明显升高(图7C)。ssGSEA算法显示,CRscore与大多数浸润免疫细胞丰度呈负相关 (图7D)。

4. 使用另一个数据集GSE106241验证 AD 患者的 CRscore 与免疫学特征之间的关联。同样,低CR患者也有更高水平的免疫细胞浸润和免疫反应。这些结果表明,CRD可以诱导AD患者免疫微环境的重塑,为单细胞水平的观察提供额外的支持(图S5)。

七、特征性 CRD 标志的综合构建

1. 为了进一步筛选与AD相关的特征性CR调控因子,首先将这些单细胞数据集中差异表达的201个CRGs拟合到基于机器学习的综合模型中,以建立共识的CRD特征。对GSE63060中的110种预测模型进行了10次交叉验证,并计算了每种模型在所有验证数据集上的AUC值。RF+Lasso组合被确定为最佳模型,平均AUC值最高(0.753)。此外,该组合模型在所有验证数据集中也显示出较高的AUC值(图8A)。

2. 基于201个差异表达的CRGs的表达格局,Boruta算法识别出GSE5281中27个重要的CRGs。随后根据这27个CRGs的表达数据,将其拟合到Lasso模型中,通过10倍交叉验证,证明最优lambda值为0.0222,实现了最小的部分似然偏差(图8B、C)。最后基于Lasso的机器学习模型识别出一组9个非零系数的特征CRD标志(图8D)。

3. 利用Lasso模型中9个特征CRGs的系数加权表达,计算每位患者的风险评分。使用6个外部数据集来比较riskScore与其他临床变量(年龄和性别)在预测AD进展方面的诊断效果。在GSE5281、GSE33000、GSE122063和GSE140829中,riskScore的准确性明显优于其他临床特征,包括年龄和性别(图8E-J)。故基于9个CRGs的风险评分可能为AD的初始诊断提供新的见解。

八、在泛癌症队列和皮质神经元中的验证

1. 为了进一步验证构成风险评分的特征CRGs的表现,接下来探讨了这些CRGs在20种癌症类型和相应的邻近正常组织中的表达水平:MEF2C、NR4A1和MAST4在大多数肿瘤中均显著下调,而几乎所有肿瘤均显著表达PSMA5、SEC61G、RGS1、CEBPB和H2AFV(图9A)。

2. 此外,作者旨在阐明这9个特征性CRGs与33种癌症预后的相关性。研究发现,所有这些基因都与至少三种癌症类型的总体生存率有相当大的相关性。特别是H2AFV、CEBPB、SEC61G、GLRX和PSMA5在多种癌症中的总生存率明显较差,这与它们在多种癌症组织中的高表达一致(图9B)。

3. RT-PCR分析显示,AD组皮层神经元中GLRX、MEF2C、PSMA5、NR4A1和SEC61G基因的表达水平明显低于对照组,而RGS1和CEBPB基因的表达水平则明显高于对照组(图9C)

研究总结:

这项研究基于昼夜节律相关基因(CRG)的转录组谱,在单细胞水平上展示了AD免疫微环境中的CRD状态。根据来自AD样本的单细胞测序数据,研究了CRscore对主要免疫细胞(B细胞,CD4+ T细胞和CD8+ T细胞)的影响,较低的CR评分与AD发病机制和进展显著相关。利用多种综合机器学习算法,为诊断AD提出了一种包括9个昼夜节律相关基因(CRGs)的CRD特征。

综上,作者结合bulk RNA测序和单细胞分析,阐明了CRD与AD异质性的密切关系,针对昼夜节律基因的药理调节可能是AD联合治疗的一种有前途的治疗策略。