肿瘤介绍

注册

 

发新话题 回复该主题

肿瘤分析数据挖掘及信息解读 [复制链接]

1#
北京治疗最好白癜风医院的偏方 http://m.39.net/pf/a_4505357.html

以下文章来源生物信息学习,作者生物信息学习

肿瘤基础

特点:

疾病,无线增殖

基因相关

细胞进化过程中发展异常,突变积累

概念:

germlinemutation:生殖细胞突变

somaticmutation:体细胞突变,不可遗传

drivermutation关键突变

passengermutation无关紧要

二次打击学说:生殖细胞和体细胞突变双重打击引发,体细胞积累起关键。所以后续主要是以体细胞突变研究为主。

癌症基因组研究趋势:小样本WES——大样本multiomics——新技术(液体活检、免疫疗法、人工智能、微生物与肿瘤、肿瘤数据中心建设)

研究情况:

生殖道、呼吸、泌尿等系统

WES和WGS为主,多组学是趋势

肿瘤基因组基础

突变特征:

点突变,Indel

CNV(K——M),增加或减少(纯合与杂合)

SV

Pathogen病毒插入

功能划分:

oncogene癌基因--功能性或激活性突变--热点突变

tumorsuppressorgene抑癌基因--截短型或失活性突变--突变分散

基本数据分析:

成对研究,如癌症癌旁

GATK

标准化数据——降维提取关键信息

肿瘤高级分析与整合:内容:

超突变样品检测

显著突变基因

新抗原预测

局部拷贝数变异

病毒整合分析

生殖系突变过滤

突变特征分析

SV突变特征分析

突变链不对称分析

突变网络分析

肿瘤分子分型

肿瘤克隆进化与异质性分析

药靶数据库注释

TCGA数据库分析

肿瘤高级分析模块

四大模块:

1.SNV和InDel1.1体细胞SNV和InDel1)超突变样本分类

常规肿瘤(regular-mutatedmutations)VS超突变肿瘤(hyper-mutatedmutations)?一般要将这两种类型样本区分来进行数据分析。

超突变样本:体细胞突变数目显著高于常规肿瘤样本。致癌机制一般不同于正常突变肿瘤。

超突变来源:外源性诱变、内源性突变、错配修复基因突变。

如何判断超突变样本:

突变数目,即肿瘤突变负荷(TMB)

样本MSI状态(MSI-status)

DNA错配修复基因是否发生突变(MMRmutation)

2)SMGs

SMGs(significantlymutatedgenes)显著突变基因(驱动基因,肿瘤发生发展起关键作用)SMGs鉴定软件:

MutSigCV:根据频率

MutSigfN:根据功能

MutSigCL:根据位置,热点突变

3)突变特征(mutationalsignatures)分析

肿瘤中体细胞突变大部分是由于暴露诱发,各种诱发因素在突变特征谱上表现不同。

目的:为了描述肿瘤在形成过程中哪个突变特征代表的内界或外界环境因素起着至关重要的致癌作用。

总共96种突变特征类型:单碱基替换6种类型(如下图)*前1bp的4种碱基*后1bp的4种碱基=64

将各种诱发因素相关的突变特征频谱进行拆解。

软件:

SigProfiler:COSMIC开发,针对单碱基、双碱基及小的InDel

signatures突变特征数据是不定期更新的。

4)突变链非对称性分析

癌症基因组中复制和转录产生的链非对称性普遍存在。非对称性突变原因:

冈崎片段长时间暴露

DNA聚合酶矫正缺陷

DNA错配修复

软件:

AsymTools:输入SNV/InDel——输出Asymmetrysignature

5)新抗原预测

MHC:即主要组织相容性复合体,又称主要组织相容性复合基因,是存在于大部分脊椎动物基因组中的一个基因家族,与免疫系统密切相关,其中人类的MHC糖蛋白又被称为人类白血球抗原(HLA)。

肿瘤新抗原:肿瘤细胞产生的非同义突变会导致肿瘤细胞表达异常蛋白,这些异常蛋白如果在细胞内被降解为短肽段(抗原表位),再与MHC分子高亲和力结合,并以复合物形式呈递到细胞表面,将被T细胞识别并引起T细胞活化,进而攻击肿瘤细胞,这种会引起T细胞活化的异常蛋白被称为肿瘤新抗原。

通过对非同义体细胞突变的分析,结合患者的HLA分型可以预测出新抗原。

软件:

pVACSeq:输入SNV/InDel(non-synonymous)——neoantigenprediction结果rank排序

1.2生殖系SNV和InDel

生殖系突变又称为遗传性突变,是通过父母遗传给后代的突变。这些突变往往在肿瘤易感中发挥重要作用。了解它们可提前预防,减少患癌风险。

2.CNV2.1局部(focal)显著CNV分析

软件:GISTIC

3.SV3.1SV特征(signature)

SVsignature类似于mutationsignature,不同突变特征的产生代表了不同的变异机制。

首先采用DBSCAN聚类算法来区分局部聚集的和分散的体细胞SV,然后根据变异类型(倒位、缺失、串联重复和易位)和长度(1-10kb,10-kb,0.1-1Mb,1-10Mb,10Mb)将结构变异分为32类,最后使用贝叶斯非负矩阵分解(NMF)算法来提取SV特征以鉴定不同的重排模式。

3.2病毒插入整合分析

研究目的:

病毒是一种重要的致癌因子,导致了10%-15%的肿瘤,如肝癌、宫颈癌,约95%的宫颈癌是由HPV感染导致。

病毒基因组插入到人基因组会引起宿主基因组不稳定,突变积累,引起整合位点附近剧烈的拷贝数变化。

帮助理解病毒的致癌机制。分析流程:

4整合分析4.1肿瘤内部克隆进化与瘤内异质性分析

肿瘤异质性:

瘤间异质性

瘤内异质性,是肿瘤内部克隆进化的结果。如同一个体不同位置取样

克隆进化研究意义:阐释肿瘤发生、发展和转移过程中的细胞群体变化规律,找出针对肿瘤不同发展阶段的主要瘤内亚克隆的治疗策略。

分析:

分析结果一般以鱼型图或进化树方法展示:

4.2突变网络分析模块1)通路富集分析

基因之间通常相互作用,在某些生物学功能中发挥重要作用。

通路富集初步分析基因可能参与的生物学过程或信号通路,了解肿瘤发生发展机制。

2)互斥和协同突变分析

观察基因突变间的相互作用以及突变类型上的一些规律,结合基因功能、样本分群或肿瘤亚克隆分类等阐释生物学意义。

应用:

定义肿瘤亚型

定义驱动基因

4.3肿瘤分子分型

基于高频突变基因

基于多组学数据聚类分析

基于突变特征

4.4数据库注释

TCGA:将感兴趣的基因在各种肿瘤中的突变频率、拷贝数扩增或缺失频率。

CIViC:药靶数据库,针对特定体细胞突变,预测靶向治疗的反应

其他IGCG,COMIC等。。。

泛肿瘤组学数据库系统bgiPETA

关于慧算

慧算专注于肿瘤精准医疗和生物医学大数据技术开发,是发改委首批“国家基因检测技术应用示范中心”和“高发肿瘤及遗传性疾病基因检测示范中心”。慧算旗下有医疗子品牌SmartOnco,提供全面覆盖的肿瘤个性化用药基因检测服务;SmartHealth慧康个人全方位基因检测、微萌专业化健康评估等子品牌,为基因数据惠民工程贡献技术力量。慧算构建了生物医学知识库和智能化评价模型,为诊疗全过程提供个性化用药基因检测和临床辅助工具,帮助分子靶向、化疗、免疫治疗等药物的用药指导和病情监测。慧算多次在国家卫计委临床检验中心举办的全国肿瘤体细胞突变高通量测序项目审评中满分通过室间质评。慧算获得上海市高新技术企业认定、长三角一体化基因检测联盟理事会理事单位。

慧算技术研发团队由国内生信领*科学家李亦学教授领衔,拥有数十名资深生物信息学专家教授和测序开发人员。同时公司聘请了众多知名院士和具有国际影响力的领域专家为公司的战略咨询专家,包括陈润生院士、杨胜利院士、赵国屏院士等。慧算依托于专家技术团队,在新一代测序技术、医学信息技术、数据库技术等领域和方面承担了国家重大专项项目,获得软件著作权和专利超60余项,发表SCI文章超篇。

慧算与上海科学院上海生物信息技术研究中心共同发起了全国首个“肿瘤液体活检多中心万人计划”,建立中国人群的多癌种的基因突变数据库,目前已完成超过00例样本的基因检测。慧算同时致力于技术推广和教育,承办了上海市生物信息学会、上海生物信息技术研究中心主办的生物信息学、肿瘤基因组学、转录组学相关培训,为公司、行业和社会输送专业人才。

预览时标签不可点收录于话题#个上一篇下一篇
分享 转发
TOP
发新话题 回复该主题