人类妇科恶性肿瘤的多组学单细胞景观
ixxmu opened this issue · comments
人类妇科恶性肿瘤的多组学单细胞景观 by 单细胞天地
文章概述
文章标题:《A multi-omic single-cell landscape of human gynecologic malignancies》
发表日期和杂志:2022年发表在Molecular Cell上
在线阅读链接:https://doi.org/10.1016/j.molcel.2021.10.013
实验设计
从手术切除后立即处理的人类卵巢和子宫内膜肿瘤共计11个样品,进行单细胞RNA-seq和单细胞ATAC-seq分析,获得了75523个scRNA-seq分析的细胞和74621个scATAC-seq分析的细胞。
单细胞转录组数据情况
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE173682
文章数据是包含了scRNA-seq以及scATAC-seq数据,我们只选择下载scRNA-seq进行分析
#samples
GSM5276933 Patient_1_3533EL_RNA
GSM5276934 Patient_2_3571DL_RNA
GSM5276935 Patient_3_36186L_RNA
GSM5276936 Patient_4_36639L_RNA
GSM5276937 Patient_5_366C5L_RNA
GSM5276938 Patient_6_37EACL_RNA
GSM5276939 Patient_7_38FE7L_RNA
GSM5276940 Patient_8_3BAE2L_RNA
GSM5276941 Patient_10_3CCF1L_RNA
GSM5276942 Patient_11_3E4D1L_RNA
GSM5276943 Patient_9_3E5CFL_RNA
提供的是10X格式的标准三个文件,选择下载我们需要的scRNA数据之后需要对数据进行整理,将三个文件分别整理到对应的文件夹中。
#整理文件
fs=list.files('./','features')
fs
samples1= gsub('.tsv.gz','',gsub('features.','',fs))
samples1
samples2 = samples1
lapply(1:length(samples2), function(i){
x=samples2[i]
y=fs[i]
dir.create(x,recursive = T)
file.copy(from= y ,
to=file.path(x, 'features.tsv.gz' ))
file.copy(from= gsub('features','matrix',gsub('tsv','mtx',y)),
to= file.path(x, 'matrix.mtx.gz' ) )
file.copy(from= gsub('features','barcodes',y),
to= file.path(x, 'barcodes.tsv.gz' ))
})
然后使用Read10X函数将数据读取进来即可进行后续的标准分析
#指定数据存放位置
samples=list.files("./scRNA/outputs/")
samples
dir <- file.path('./scRNA/outputs/',samples)
names(dir) <- samples
#读取数据创建Seurat对象
counts <- Read10X(data.dir = dir)
sce.all = CreateSeuratObject(counts,
min.cells = 5,
min.features = 300 )
dim(sce.all) #查看基因数和细胞总数
as.data.frame(sce.all@assays$RNA$counts[1:10, 1:2])
table(sce.all@meta.data$orig.ident) #查看每个样本的细胞数
head(sce.all@meta.data)
对读取进来的数据进行质控、harmony整合以及单细胞细分亚群定义等。
第一层次降维聚类
对来自整个队列的75,523个scRNA-seq细胞,使用前2,000个可变表达基因进行主成分分析(PCA)。使用前50个主成分(PCs)将细胞分类为转录不同的簇,并使用UMAP图进行可视化以及细胞亚群注释(左图)
使用临床生物标志物基因表达和推断拷贝数扩增/缺失事件,识别整个队列中的恶性集群(左图)
在整个队列中发现了10种一般细胞类型,其中有36个亚簇存在于两种模式中。尽管这些亚簇的大小不同,但免疫亚簇在所有患者中包含的细胞比例大致相等,而恶性和成纤维细胞亚簇仍然具有高度的患者特异性
其他主要分析概述
scATAC-seq分析妇科肿瘤肿瘤特异性远端调控元件(DRES)的系统发现
使用scATAC-seq元细胞(即相似细胞的聚集体)来计算每个峰的可及性与每个scATAC-seq细胞的顺式基因表达之间的相关性,这种峰对基因的相关性分析在顺式基因中产生了2,748,906个峰对基因组合。
然后对峰对基因组合进行了一系列分析,对ATAC分析感兴趣的可以根据文章具体了解一下。
子宫内膜样癌(EEC)的肿瘤特异性调控机制分析
合并了患者1-5的所有细胞,得到了scRNA-seq分析的32,234个细胞和scATAC-seq分析的32,155个细胞。分析发现,细胞主要按细胞类型聚集,而不是按患者聚集。
使用生物标记物MUC16/CA125和WFDC2/HE4筛选恶性亚群,观察到成纤维细胞/基质和EC亚群是高度患者特有的
子宫内膜癌中的四个亚群几乎完全由来自患者3(6、14、15和21)的细胞组成,这表明该肿瘤具有高度的肿瘤内异质性。
高级别浆液性卵巢癌(HGSOC)癌细胞群体获得肿瘤特异性耐药相关基因
合并了患者8和9的所有细胞,得到了scRNA-seq分析的13,646个细胞和scATAC-seq分析的17,677个细胞。
观察到了患者8和9的6种一般细胞类型,其中在scRNA-seq中有24个亚群,在scATAC-seq中有19个亚群
为了了解这些亚群的调控格局,进行了峰到基因的连锁分析,以确定可能是癌症特异性的DRES驱动了恶性群体的转录图谱(图C)。
还强调了两个癌症特异性DRE,它们与HGSOC患者队列中恶性部分LAPTM4B表达的增加密切相关(图D)
LAPTM4B预测OC患者的生存率较低,已被报道为化疗药物外流以及PI3K/AKT信号转导的有效促进剂(图E)
文章小结
文章展示了手术切除后立即处理的人类卵巢和子宫内膜肿瘤的单细胞分辨率下匹配的转录组(scRNA-seq)和染色质可及性谱(scATAC-seq)。 数据集揭示了这些肿瘤复杂的细胞异质性,能够定量地将染色质可及性的变化与基因表达联系起来。 分析发现恶性细胞获得以前未注释的调控元件来驱动标志性的癌症途径,来自同一患者的恶性细胞显示出与转录输出相关的染色质可及性的实质性差异,突出了肿瘤内异质性的重要性。 推断了恶性细胞类型特异性转录因子的活性。
单细胞与bulk转录组联合分析揭示了基于T细胞标记基因的肺腺癌分子亚型及其预后标志
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
看完记得顺手点个“在看”哦!
长按扫码可关注