单细胞测序技术研究癌症之通路富集分析
“一只南美洲亚马逊河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,可以在两周以后引起美国得克萨斯州的一场龙卷风。”
上面这句话是对蝴蝶效应的常见阐述。但其实,蝴蝶效应的含义是指一个系统内,初始微小的变化经过一系列连锁放大反应后将产生巨大的后果。
癌症的发生发展也是一个类似“蝴蝶效应”的过程。最开始发生突变的那个正常细胞增殖后形成的起始肿瘤细胞群,经过一系列的突变和选择形成一群增殖、存活、入侵和转移能力逐渐增加的肿瘤细胞群(图1)【1】,最终变成一场“席卷”人体的“龙卷风”——癌症。
如何“阻止”这场发生于人体内的“蝴蝶效应”呢?或许,确认肿瘤细胞是从哪种正常细胞“演化”而来,挖掘肿瘤细胞转录组的变化,能够帮助遏制这场“龙卷风”。
scRNA-seq(单细胞RNA测序)技术使得高通量、快速地比较大量单个细胞间转录组差异成为现实,研究者得以在单个细胞水平上进行转录组比较,探索转录组发生的“细微”波动及其生物学意义。这些发现将有助于开发新的诊断、治疗策略,把肿瘤细胞“煽动翅膀”产生的影响降到最小。
其中,通路富集分析能帮助研究者认识细胞行为变化背后的分子机制。本期将通过两个文献实例——NSCLC(非小细胞肺癌)和PDAC(胰腺导管腺癌),介绍如何使用通路富集分析,研究细胞间的基因转录水平变化及其生物学意义。
01
—
非转移性非小细胞肺癌
虽然已有遗传多样性和克隆选择证据证实了癌细胞的复杂多样性,但对肿瘤相关基底细胞及其构建的TME(肿瘤微环境)复杂程度和异质性认识尚不完善【2,3】。
为了研究基底细胞异质性及其对肿瘤的适应,Lambrechts 等(2018,Nature Medicine)对来自5名有吸烟史、未经治疗的、原发性、非转移性非小细胞肺癌(NSCLC)患者的肿瘤样本及良性肺组织样本进行了单细胞RNA测序,分析了52,698个细胞的转录组数据。
所有数据的t-SNE降维聚类分析显示存在8种类型细胞,其中7种是基底细胞。随后,Lambrechts 等【4】为深入认识这些基底细胞的异质性,分别抽取不同类型基底细胞进行分析。
以ECs(内皮细胞)的通路富集分析为例。肿瘤样本中ECs的Myc target v1是富集程度最高的信号通路(图2),这或许解释了肿瘤样本ECs的转录上调现象【5】,也意味着肿瘤ECs可能易受Myc抑制剂影响(Myc一种原癌基因,编码产物调控特定靶基因转录)。
对ECs进行代谢通路富集分析显示(图3,嘧啶代谢通路富集分析结果未显示),肿瘤样本ECs的核苷酸代谢相关通路明显上调,说明肿瘤样本ECs的转录需求增加;氧化磷酸化和糖酵解代谢通路表达水平也显著升高,有研究显示抑制内皮细胞糖酵解能使得小鼠肿瘤血管生产正常化【6】。
图3 NSCLC肿瘤样本和良性样本中ECs的嘌呤代谢通路富集分析结果【4】。肿瘤样本ECs的嘌呤代谢相关基因表达水平上调。
通过通路富集分析,Lambrechts 等【4】揭示了TME中不同类型基底细胞发生的通路变化。例如,相比于良性组织,肿瘤内皮细胞下调了免疫细胞归巢通路(图2)。Lambrechts 等【4】认为肿瘤基质的这些特征可能代表了肿瘤的“弱点”,可用作新疗法的设计切入点。
02
—
胰腺导管腺癌
图4 与聚群2相比,3个肿瘤来源的导管细胞亚群富集了已知的PDAC驱动通路和炎性相关通路【7】。
Elyada等【7】前期研究发现PDAC的TME(肿瘤微环境)中存在两种CAFs(肿瘤相关成纤维细胞):iCAF和myCAF。为了进一步确认这两种CAFs的存在,Elyada等【7】筛选出CAFs进行分析。对CAF进行的富集分析结果发现,有些通路在iCAFs和myCAFs中的表达水平不一致。平滑肌收缩、黏着斑、胞外基质组织和胶原合成通路在myCAFs中明显上调;而iCAFs的炎性通路(如IFNγ应答、TNF/NF-κB、IL2/STAT5、IL6/JAK/STAT3)和补体途径的表达上调(图5)。
Elyada等【7】的研究确认了人PDAC中存在两种有着不同通路活性的CAF,可以帮助开发新的PDAC治疗手段。
03
—
总结
龙卷风是不可抵挡的,正如癌症“来势汹汹”难以招架;不是每只蝴蝶都会引发龙卷风,正如不是每个体细胞都会突变继而引起癌症。
我们可以为了阻止龙卷风杀死所有蝴蝶。

但我们不能为了避免患癌杀死自己体内所有细胞。
特别地,与正常细胞相比,肿瘤细胞经过“演化”获得了多个“有利”的基因突变(图1)。因此,只有全面、整体地认识许多差异表达基因所代表的生物学意义,才有可能“打败”癌症!
其中,通路富集分析是针对差异表达基因进行数据库中通路的功能注释和归类,帮助研究者认识肿瘤细胞或TME中基底细胞的转录水平变化所代表的生物学意义,继而“真正”指导新诊疗手段的开发。
04
—
绘真生信讲堂之通路富集分析
前两期介绍了t-SNE降维聚类分析和伪时间分析。那么,这几种方法该怎么用呢?

是滴,以后会不定期冒出小讲堂哦~~
举个例子。过滤和质控处理完成的数据,进行t-SNE降维聚类分析后,得到的结果如图6。
图6 t-SNE降维聚类结果
从中抽取Cluster 0,选择GO基因注释库进行富集分析。为了便于展示,从GO功能富集分析结果中,对最显著的Top50个Terms'绘制柱状图和气泡图进行展示(图7)。红色代表富集到该GOTerm上的P值越小,显著性越高;蓝色代表富集到GOTerm上的P值越大,显著性越低。从结果可知,Cluster 0的差异表达基因与Neutrophil activation, Neutrophil mediated immunity, Neutrophil degranulation, Neutrophil activation involved in immune response这四个Term显著相关。
图7 A图:柱状图,纵坐标为富集的GO Term,横坐标为每个富集的GO Term(纵坐标)中的基因数。B图:气泡图,纵坐标为富集的GOTerm,横坐标为GeneRatio,代表每个富集的GO Term中的基因数占整体输入基因的百分比。图中圆圈大小代表基因数目,圆圈越大代表基因数目越多,圆圈越小代表基因数目越少。
绘真医学 RedRockTM超高通量单细胞转录组测序分析
报告中的高级分析及个性化分析囊括了多种降维可视化聚类展示结果,为您的研究提供有力支持!
参考文献
更多信息请关注我们的网站
www.geno-truth.com/singlecell
联系电话:4000-672-118
服务邮箱:service@geno-truth.com