引言与此同时,驱动基因也不再是比较陌生的行业,越来越频繁的进入大众的视线,获得更多的关注和认可。
免疫肿瘤学是一个新兴的研究领域,为癌症患者及与其抗争的人
们展现了巨大的希望。它也代表科学界有机会更好地了解肿瘤与
免疫系统的相互作用所涉及到的生物学机制。新发现正带来改良
的基因组学方案,它们能够推动新型疗法的开发,并预测患者对免
疫治疗的响应。新一代测序(ngs)的应用是在这些探索中的一项
关键技术。illumina已经开发出测序工具和数据分析工具,让任何
一个研究小组都能轻松开始他们自己的免疫肿瘤学实验。
多种免疫治疗方式已经开发出来,用于阻断癌症逃避免疫破坏的
能力,让研究人员能够以个性化的方式瞄准肿瘤。
1在理想的情况
下,因肿瘤中的非同义体细胞突变而产生的突变蛋白会作为抗原
出现在癌细胞的表面,被免疫系统所识别。然而,癌细胞采用各种
策略来逃避免疫系统的识别和清除。第一个是表达免疫检查点通
路的组分,如pd-l1,来抑制t细胞的激活。第二个策略是通过募集
肿瘤相关的巨噬细胞和调节性t细胞,它们阻断细胞毒性t细胞的
渗透,从而改变肿瘤微环境。
2
检查点抑制剂,如针对ctla4和pd1的抗体,最近获得了美国fda
的批准,在一部分特定癌症患者上显示出疗效,如黑色素瘤和非小
细胞肺癌。证据还表明,非同义突变越多的癌症患者对检查点抑制
剂疗法的响应越好。
3-5一种更加个性化的免疫治疗是根据肿瘤特异
的非同义dna改变形成的新抗原来开发癌症疫苗。
6新抗原持续刺
激细胞毒性t淋巴细胞,在检查点抑制剂存在或一种有利的免疫微
环境下,可能清除癌细胞。
本应用指南介绍了两个免疫肿瘤学流程。第一个流程采用全外显
子组测序(wes)和全转录组测序(wts)来预测癌细胞出现的新抗
原。研究表明,总的突变负荷和特异的新抗原特征可能预测对免
疫肿瘤学疗法的响应。第二个流程采用wts来鉴定肿瘤微环境,
包括研究重要的表达标志物(如免疫调控基因、肿瘤特定的变异,
和融合)。这些工具能够完全胜任检测低水平表达的目标。相比之
下,基于杂交的技术难以达到这种动态范围和灵敏度。wes和wts
测序可利用illumina的nextseq?或hiseq?系列测序系统来开展。
illumina的测序试剂盒已经为ffpe或新鲜/冷冻样本的文库制备
而优化。illumina的truseq?exome和truseqrnaaccesslibrary
preparationkit利用同一种序列特异捕获技术来靶定外显子区域。
内容上的匹配让研究人员能够靶定和比较rna和dna的等价区域。
两个流程都使用basespace?informaticssuite,让任何研究人员
都能快速分析ngs数据,并灵活鉴定肿瘤样本的免疫肿瘤学图谱。
neoantigen
prediction
rna-seqalignment
tumorwtsfastq
isaacenrichment
tumor/normalwesfastq
variantstudio
variantcalling
assessmenttool
intersectedvcf
nonsynonymousvariants
genetable
basespacesequencehub
tumor
wesvcf
normal
wesvcf
tumor
wtsvcf
gene
fpkm
图1:新抗原发现流程-利用basespacesequencehub的应用程序,免
疫通路的ngs分析可高效开展,研究人员即使没有信息学经验,也能完
成。vcf=变异检出文件。fpkm=每百万条映射片段中每千个碱基的
转录本所包含的片段。
新一代测序进行免疫肿瘤学研究的
生物信息学工具
经过改良的生物信息学工具是基于标准的illumina测序应用程序所开发,实现了新抗原的发现和
肿瘤微环境的分析
仅供研究使用。不得用于诊断。
技术说明:信息学
通过整合wes和wts分析来发现新抗原
这个操作总结了生成候选新抗原的步骤,它利用basespace
sequencehub的应用程序,分析一项wes和wts混合研究中
的数据(图1)。在开始时,wes肿瘤–正常数据和wts肿瘤数据从
测序仪上直接接入basespacesequencehub。在测序完成后,
sequencehub产生各自的fastq文件。数据分析以四个主要步
骤开展:
1.利用basespacesequencehub中的isaacenrichmentv2.1
应用程序进行肿瘤–正常配对样本的wes比对和变异检出。
输入的是肿瘤wesfastq和正常wesfastq文件。isaac
enrichment应用程序输出的是一份全面注释的变异检出文件
(vcf)。
2.利用basespacesequencehub中的rna-seqalignmentv1.1
应用程序开展wts比对、基因表达预测和平行变异检出。输入
的是肿瘤wtsfastq文件。应用程序输出的是wtsvcf文件以
及基因表达计数文件(原始和fpkm)。基因表达定量被用在新
抗原预测的最后一步。
3.利用basespacesequencehub中的variantcalling
assessmenttoolv2.3应用程序,从肿瘤数据中过滤掉假阳性
变异,将重点放在wes和wts肿瘤变异交集中的表达变异。输
入的是第一步中的肿瘤wesvcf文件和第二步的肿瘤wtsvcf
文件。输出的是vcf交集文件,它只包含在wes和wts肿瘤数据
中都存在的变异。
4.确定与新抗原预测相关的变异,在basespacesequencehub
中的variantstudio应用程序中加载wes/wts交集的肿瘤vcf
文件和wes正常vcf文件。点击按钮,所有相交的变异都注释有
转录本信息、后果、群体频率,以及从外部其他数据库提取的材
料(如cosmic、clinvar和dbsnp)。然后利用variantstudio过滤
相交的变异,第一次排除wes正常样本中的变异。之后过滤剩
下的变异,保留非同义变异以及群体中不足1%的变异。这些变
异被导出,并用于新抗原预测。
dnavaf
rnavaf
0%
10%
20%
30%
100
missense
neoorf
50
20
40%
50%
60%
0%10%20%30%40%50%60%70%80%
fpkm
varianttype
5
2
1
图2:通过气泡图鉴定新抗原-潜在新抗原的鉴定是基于突变类型(蓝色:错
义;黄色:neoorf)、dna和rna等位基因频率(x和y值),以及基因表达水平
(圆圈大小)。vaf=变异等位基因频率。fpkm=每百万条映射片段中每千
个碱基的转录本所包含的片段。
理想的候选新抗原在肿瘤dna和rna样本中都有着高的变异等位
基因频率(vaf)。在变异类型上也存在其他的优先次序,如移码的
剪接位点突变导致新生的开放阅读框(neoorf)。与错义突变相
比,一些变异完全是肿瘤特异的。选择中等至高水平的rna表达,可
进一步过滤新抗原候选。基于以上标准,最终的新抗原候选可根据
dna和rnavaf、突变类型(错义vsneoorf)和基因表达水平来优
先选择(图2)。
潜在的新抗原可根据它们与单个hlai类分子的亲和力而进一步过
滤。常用的工具包括质谱分析和/或mhc关联的新抗原预测的计算
机算法。目前网上有一些计算机预测算法(表1)。
表1:计算机预测算法
应用算法url
利用wes数据的hla基因分型
polysolverwww.broadinstitute.org/cancer/cga/polysolver7
optitypegithub.com/fred-2/optitype8
hlai类分子的结合亲和力预测
netmhcwww.cbs.dtu.dk/services/netmhc/9
syfpeithiwww.syfpeithi.de/10
仅供研究使用。不得用于诊断。
技术说明:信息学
肿瘤微环境分析
为了评估肿瘤微环境,wts样本从测序仪直接接入basespace
sequencehub。在测序完成后,sequencehub产生各自的fastq
文件。数据分析以两个步骤开展(图3a):
1.利用basespace中的rna-seqalignmentv1.1应用程序开展
肿瘤–正常样本的wts比对和基因表达估计。为了轻松查看肿
瘤微环境的相关基因,现在有一个免疫肿瘤学过滤器,可以只
显示与免疫调控和癌症通路相关的基因的基因表达计数信息
(图3b)。输出文件,包括二进制定位图谱(bam)文件,被下一
步的differentialexpression应用程序自动识别。这一应用程序
也开展fpkm估计、新型转录本的组装、变异检出和可选的融合
检出。
2.利用basespacesequencehub中的cufflinksassembleand
dev2.1或deseqv2.1应用程序对肿瘤–正常配对样本开展差异
表达分析。differentialexpression应用程序也允许只生成与肿
瘤微环境相关的内容,以第1步的结果作为输入内容。输出内容
包括一份整体的分析报告,汇总了统计数据,包括样本相关性
(图3c)、融合表达差异的免疫肿瘤学基因的差异表达热图,以
及以各种参数过滤的基因浏览器(图3d)。
或者,研究人员也可以使用差异表达基因(它们的特征)的列表进
行下游的通路分析或基因集的富集分析。目前网上有一些常用算法
(表2)。
表2:通路分析和基因集合富集的算法
应用描述url
basespacecorrelationengine在两万多项研究和通路中比较特征www.nextbio.com/b/nextbio.nb11
davidbioinformaticsresources针对通路、基因本体及其他来检验富集特征david.ncifcrf.gov/12
genesetenrichmentanalysis(gsea)针对特征数据库来检验富集特征software.broadinstitute.org/gsea/index.jsp13
ab
cd
cuffinksassembly&de
(immuno-oncologyfilter)
rna-seqalignment
(immuno-oncologyfilter)
downstream
pathway/genesets
enrichmentanalysis
basespacesequencehub
图3:利用basespacesequencehub中的应用程序分析肿瘤微环境的流程-a.basespace流程包括比对步骤,接着是差异表达分析。b.免疫肿瘤学过滤器适
用于这两个步骤,让输出内容只显示与肿瘤微环境相关的基因。c.差异表达分析的输出,显示样品关联,用于整体的基因表达分析。d.差异表达分析的输出,
显示免疫肿瘤学基因的热图和散点图。
技术说明:信息学
illumina中国
上海办公室?电话?(021)6032-1066?传真?(021)6090-6279
北京办公室?电话?(010)8455-4866?传真?(010)8455-4855
技术支持热线?400-066-5835?techsupport@illumina.com?www.illumina.com.cn
仅供研究使用。不得用于诊断。
?2016illumina,inc.保留所有权利。illumina,basespace,hiseq,nextseq,truseq和南瓜橙色是illumina,inc.的商标或注册商标。本文档包
含的所有其他品牌和名称均为其各自所有者的财产。pub.no.1170-2016-013currentasof07april2016
结语
illumina的ngs技术帮助获得了癌症基因组学的大量信息,包括
肿瘤dna和rna图谱分析的特殊应用和宿主环境。利用新的信息
学工具,成熟的ngs方法可根据免疫肿瘤学的应用而进一步定制。
basespacesequencehub可以与nextseq和hiseq系列测序系
统相整合,利用truseqexome和rnaaccesslibraryprepkit。
basespaceinformaticssuite为分析带来灵活性和效率,让免疫肿
瘤学研究对任何研究小组而言触手可及。
了解更多
如欲深入了解ngs在免疫治疗中的应用,请访问
www.illumina.com/immuno-oncology
参考文献
1.hanahand,weinbergra.hallmarksofcancer:thenextgeneration.
cell.2011;144(5):646-674.
2.gajewskitf,schreiberh,fuyx.innateandadaptiveimmunecells
inthetumormicroenvironment.natimmunol.2013;14(10):1014-1022.
3.snydera,makarovv,merghoubt,etal.geneticbasisforclinicalresponseto
ctla-4blockadeinmelanoma.nengljmed.2014;371(23):2189-2199.
4.rizvina,hellmannmd,snydera,etal.cancerimmunology.mutational
landscapedeterminessensitivitytopd-1blockadeinnonsmallcelllung
cancer.science.2015;348(6230):124-128.
5.ledt,uramjn,wangh,etal.pd-1blockadeintumorswith
mismatch-repairdeficiency.nengljmed.2015;372(26):2509-2520.
6.castlejc,kreiters,diekmannj,etal.exploitingthemutanomefortumor
vaccination.cancerres.2012;72(5):1081-1091.
7.shuklasa,rooneyms,rajasagim,etal.comprehensiveanalysisof
cancer-associatedsomaticmutationsinclassihlagenes.natbiotechnol.
2015;33(11):1152-1158.
8.szoleka,schubertb,mohrc,sturmm,feldhahnm,kohlbachero.
optitype:precisionhlatypingfromnext-generationsequencingdata.
bioinformatics.2014;30(23):3310-3316.
9.andreattam,nielsenm.gappedsequencealignmentusingartificial
neuralnetworks:applicationtothemhcclassisystem.bioinformatics.
2016;32(4):511-517.
10.schulermm,nastkemd,stevanovikcs.syfpeithi:databaseforsearching
andt-cellepitopeprediction.methodsmolbiol.2007;409:75-93.
11.kupershmidti,suqj,grewala,etal.ontology-basedmetaanalysisofglobal
collectionsofhigh-throughputpublicdata.plosone.2010;5(9).pii:e13066.
doi:10.1371/journal.pone.0013066.
12.huangdaw,shermanbt,lempickira.systematicandintegrativeanalysis
oflargegenelistsusingdavidbioinformaticsresources.natprotoc.
2009;4(1):44-57.
13.subramaniana,tamayop,moothavk,etal.genesetenrichmentanalysis:a
knowledge-basedapproachforinterpretinggenome-wideexpressionprofiles.
procnatlacadsciusa.2005;102(43):15545-15550.