  • ABSOLUTE - 从SNPs、CNVs推断肿瘤纯度、倍数。还可检测亚克隆异质性。

    • Aran, Dvir, Marina Sirota, and Atul J. Butte. “Systematic Pan-Cancer Analysis of Tumour Purity.” Nature Communications 6, no. 1 (December 2015). https://doi.org/10.1038/ncomms9971. - TCGA肿瘤纯度评估采用四种方法: ESTIMATE, ABSOLUTE, LUMP, IHC, 和中位数一致性进行评估。 基因表达与纯度有关,可能影响相关和差异表达检测分析 - data/ABSOLUTE_scores.xlsx - Supplementary Data 1: 根据四种方法估计肿瘤纯度,并对所有TCGA样本用现有数据进行一致性分析. Source
  • ESTIMATE (利用表达数据估计恶性肿瘤组织中的间质细胞和免疫细胞)是预测肿瘤纯度的工具,利用基因表达数据预测肿瘤组织中是否存在浸润的间质/免疫细胞。评估算法基于单样本基因集富集分析,生成三个分数:间质分数(捕获肿瘤组织中间质的存在)、免疫分数(表示肿瘤组织中免疫细胞的浸润)和评估分数(推断肿瘤纯度)。 http://bioinformatics.mdanderson.org/main/ESTIMATE:Overview. R包 http://bioinformatics.mdanderson.org/estimate/rpackage.html

  • data/ESTIMATE_signatures.xlsx - 间质和免疫特征的基因列表。 Source

  • data/ESTIMATE_scores.xlsx - TCGA数据集中间质、免疫和评估得分的列表。所有的癌症,所有的基因表达形式。Source

  • ISOpureR - 反卷积策略计算肿瘤轮廓,以提高肿瘤纯度。基于回归的方法,利用纯化的肿瘤剖面来估计肿瘤样本的比例。讨论过参数化引起的过拟合。 https://cran.r-project.org/web/packages/ISOpureR/index.html

  • DeepPATH - 利用深卷积神经网络对肺癌图像进行分类。按肿瘤类型、突变类型分类。参考其他使用深度学习的图像分类研究。GoogleNet inception v3架构。培训、验证、测试团队(70%、15%、15%)。图像处理的细节。 https://github.com/ncoudray/DeepPATH

  • IHCount - IHC-分析软件, https://github.com/mui-icbi/IHCount

  • pathology_learning - 利用传统的机器学习和深度学习方法对TCGA病理切片进行预测。 https://github.com/millett/pathology_learning



  • cBioPortal - 癌症基因组学cBioPortal提供大规模癌症基因组数据集的可视化、分析和下载。OncoPrint突变图,差异表达,共表达,存活。比较基因表达与拷贝数变异。 http://www.cbioportal.org/

  • R2 - 基因组分析可视化平台。以基因为中心,生存分析,预处理RNA微阵列研究的收集. http://hgserver1.amc.nl/

  • KM plotter - Gene-centric, 可定制的乳腺癌、卵巢癌、肺癌、胃癌的生存分析. http://kmplot.com/

  • The Human Protein Atlas - 基因和蛋白质在多种癌症组织、细胞系中的表达数据。简单的单基因搜索,总结组织特异性表达,生存意义。 http://www.proteinatlas.org/

      • Table S2 - 在正常组织和癌组织中,每种基因的组织特异性表达概述。
      • Table S6 - 生存预后价值的总结,每个基因都有一个简单的“有利/不利”标签。每个工作表对应一个不同的癌症。
      • Table S8 - 每个基因的总结,在其中癌症是生存的预后。
  • PRECOG - 从基因组谱预测临床结果。以基因为中心,快速概述一个基因在所有癌症中的生存效应,KM图。 https://precog.stanford.edu

  • GEPIA - TCGA数据的单基因和多基因分析。基因表达在不同肿瘤正常比较,差异表达基因,相关分析,相似基因,生存分析。 http://gepia.cancer-pku.cn/

  • GEPIA2 - TCGA分析。癌症subtype-specific分析。八种类型的表达分析,以及附加的癌症亚型分类器和表达比较。用于API访问的Python包。 http://gepia2.cancer-pku.cn

  • UALCAN - 以基因为中心,肿瘤正常表达,生存分析,TCGA癌症。 http://ualcan.path.uab.edu/

  • Project Betastasis - 以基因为中心,生存分析,基因表达,选择癌症研究。 http://www.betastasis.com/

  • OncoLnc - 基因中心,任何TCGA癌症的生存分析。 http://www.oncolnc.org/


  • KMplotter - Kaplan Meier绘图仪能够通过18,674个癌症样本评估54,675个基因对生存率的影响。其中包括5143名乳腺癌患者,1816名卵巢癌患者,2437名肺癌患者,364名肝癌患者,1065名胃癌患者,无复发和总体生存数据。miRNA子系统还包括来自20种不同癌症类型的11,456个样本。该工具的主要目的是基于meta分析的生物标志物评估。

  • ctree 自动切断发现和建立一个多元协变量的回归树。 partykit::ctree()

  • Cutoff Finder - web工具,用于寻找关于结果或生存变量的最优二分法。五个方法. http://molpath.charite.de/cutoff/

  • Cancer Gene Census (CGC), 下载 COSMIC

    • data/Census_all*.csv - The cancer Gene Census
    • data/COSMIC_genes.txt - :根据与之相关的记录数量对基因进行排序。获得使用 zcat <CosmicCompleteTargetedScreensMutantExport.tsv.gz | sed '1d' | cut -f1 | sort | uniq -c | sort -k1 -r -n > COSMIC_genes.txt
    • data/CosmicCodingMuts.vcf.gz - VCF file.
  • Tumor suppressor gene database (TSGene), https://bioinfo.uth.edu/TSGene/

    • Download various lists of tumor suppressor genes, https://bioinfo.uth.edu/TSGene/download.cgi
  • OncoScape - 致癌基因/抑癌基因/综合得分作为基因表达、体细胞突变、DNA拷贝数和甲基化以及shRNA敲除筛选数据。 http://oncoscape.nki.nl/

  • data/Bailey_2018_cancer_genes.xlsx - Table S1, 癌症驱动基因的一致列表

  • data/TARGET_db_v3_02142015.xlsx - TARGET(与基因组驱动治疗相关的肿瘤改变)是一个基因数据库,当癌症发生体细胞改变时,这些基因与临床行为直接相关。靶基因可以预测治疗的反应或耐药性、预后和/或诊断 https://software.broadinstitute.org/cancer/cga/target

  • data/Tokheim_2016_cancer_driver_genes.xlsx - Dataset S2:用多种方法预测驱动基因

  • clinvar - 将ClinVar数据转换为以制表符分隔的平面文件的工具,还提供了生成的以制表符分隔的文件。 https://github.com/macarthur-lab/clinvar

  • CANCERSIGN - 识别3-mer和5-mer突变签名,通过签名聚类样本。基于Alexandrov方法,非负矩阵分解处理获得。 compared in Table 1. https://github.com/ictic-bioinformatics/CANCERSIGN

  • CARE - 从药物靶基因与其他基因的相互作用中鉴定生物标志物。具有交互项的多元线性建模。说明BRAF突变与EGFR表达相互作用的例子。基因表达相关性与护理评分的样本分离更能预测生存率。比较相关,支持向量回归. http://care.dfci.harvard.edu/, download page http://care.dfci.harvard.edu/download/, nls_logsig tool to compute AUC for dose curves.

  • CellMinerCDB - 癌症细胞系的基因组学(基因表达、突变、拷贝数、甲基化和蛋白质表达)和药物基因组学(药物反应和基因组相互作用)分析。 结合 NCI-60, GDSC, CCLE, CTRP, 和 NCI-SCLC 数据库上建立 rcellminer R 包.相关和多元分析。组织分析. https://discover.nci.nih.gov/cellminercdb/,

  • DSigDB - drug-gene 数据库. D1(批准药物),D2(激酶抑制剂),D3(微扰剂标记),D4(计算预测). 下载及在线. http://tanlab.ucdenver.edu/DSigDB/DSigDBv1.0/download.html

  • GDA - 基因组学与药物综合分析. The Genomics and Drugs integrated Analysis portal (GDA) is 是一个基于web的工具集合 NCI60和CCLE基因突变和表达谱的药物敏感性数据。 基因到药物和反向分析. http://gda.unimore.it/

  • OncoKB - 癌基因数据库,不同水平的证据,完全可下载. http://oncokb.org

  • CancerRxGene - Drug-gene 目标. 很多药物敏感信息. http://www.cancerrxgene.org/

  • CTRP - The Cancer Therapeutics Response Portal (CTRP) 加速发现与病人相匹配的癌症疗法的目标。. https://portals.broadinstitute.org/ctrp/

  • 药物联合筛选,协同作用。统计分析用于大型药物筛选,108种药物,40个细胞株。独立模型描述。Bliss-based 线性模型来评估单个药物的生存能力. Web: http://www.cmtlab.org:3000/combo_app.html. Code 分析: https://github.com/arnaudmgh/synergy-screen. 原始数据: https://raw.githubusercontent.com/arnaudmgh/synergy-screen/master/data/rawscreen.csv

TCGA PanCancer

  • ATAC-seq数据来自TCGA(23种癌症类型)的410个肿瘤样本。与基因表达的相关性预测远端相互作用。按癌症类型划分的18个集群。数据: https://gdc.cancer.gov/about-data/publications/ATACseq-AWG 

  • 来自PanCancer出版物的论文和补充数据。临床注释、RNA-seq计数、RPPA、甲基化、miRNA、拷贝数、.maf格式突变. https://gdc.cancer.gov/about-data/publications/pancanatlas

  • 泛癌分析由TCGA联合发表,全部论文. https://www.cell.com/pb-assets/consortium/pancanceratlas/pancani3/index.html

  • PCAGW - PCAWG研究是一项国际合作,旨在确定来自国际癌症基因组联盟的2800多个癌症全基因组的常见突变模式。该项目产生了大量类型多样的数据,包括简单的体细胞突变(SNVs、MNVs和小indel)、大规模的体细胞结构变异、拷贝数改变、种系变异、RNA表达谱、基因融合、表型注释等。PCAWG数据已被导入、处理并提供给以下四种主要的在线资源供全球癌症研究人员下载和探索。 http://docs.icgc.org/pcawg/


  • MEXPRESS - 基因中心甲基化与临床参数的关系. http://mexpress.be/

  • Pancan-meQTL 23种TCGA癌症类型的meQTLs数据库 Cis-, trans-meQTLs, pancancer-meQTLs, survival meQTLs. SNP-, gene-, CpG-centric 对于不同癌症类型. 图例, KM-survival图. Download. http://bioinfo.life.hust.edu.cn/Pancan-meQTL/

    • Gong, Jing, Hao Wan, Shufang Mei, Hang Ruan, Zhao Zhang, Chunjie Liu, An-Yuan Guo, Lixia Diao, Xiaoping Miao, and Leng Han. “Pancan-MeQTL: A Database to Systematically Evaluate the Effects of Genetic Variants on Methylation in Human Cancer.” Nucleic Acids Research, September 7, 2018. https://doi.org/10.1093/nar/gky814.

