一篇基于R语言的scRNA-seq文章复现
1 文章概述
2023年发表于Journal of Translational Medicine,IF=7.4
2 文章实验设计
目的:研究NK细胞和肿瘤细胞在非角化性鼻咽癌(NK-NPC)中的作用,NK-NPC与EBV感染密切相关
方法:收集3例NK-NPC样本和3例正常鼻咽黏膜样本进行蛋白质组分析,联合GSE162025(NK-NPC单细胞转录组数据)和GSE150825(NLH单细胞转录组数据)进行分析
分析步骤:
-
对蛋白组数据进行分析,发现NK细胞介导的细胞毒性相关蛋白显著下调,NK细胞功能可能受到抑制。
-
免疫组化发现NK-NPC样本中,与NK细胞相关的B2M,CD56+,Granzyme B均下调
-
对NK-NPC单细胞转录组样本进行分析,T细胞,B细胞,NK细胞在所有类型的细胞中排名前三
-
对NK细胞取子集进行细分,得到1个mast cell和3个NK细胞cluster,从NK细胞毒性激活/抑制,细胞通讯,NK细胞功能相关的标志物,NK细胞介导的毒性通路等角度进行分析,并用NLH单细胞转录数据集进行验证
-
对上皮细胞取子集进行细分,用copykat鉴定良性和恶性上皮细胞,对恶性上皮细胞再进行细分,得到tumor1和tumor2两类,考察多个关键基因,发现EBV感染可能与tumor1相关
-
对tumor1再取子集,得到4个cluster,用拟时序分析4个cluster之间的演变过程,分析了关键基因和通路在不同cluster之间的变化,推测EBV感染的机制
3 复现前准备
3.1 数据
数据 | 数据说明 | 来源 |
---|---|---|
12967_2023_4112_MOESM1_ESM.xlsx | NK-NPC蛋白质组学结果 | 文献附件 |
GSE162025_RAW | 使用单细胞转录组和 T 细胞受体测序对分析来自 10 对 NPC 肿瘤血对的 176,447 个细胞 | https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE162025 |
GSE150825_RAW(barcodes.tsv.gz, features.tsv.gz, matrix.mtx.gz) | 鼻咽癌微环境的单细胞转录组分析和免疫谱分析 | https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?&acc=GSE150825 |
3.2 平台和软件
1 |
|
软件 | 版本 |
---|---|
R | 4.3.1 |
RStudio | 2024.04.0 |
4 复现流程
4.1 导入包
1 |
|
4.2 NK-NPC蛋白质组学分析
1 |
|
Fig.1.A NK-NPC蛋白质组学差异分析结果的火山图,与正常组相比,NK-NPC组有76种蛋白上调,85种蛋白下调,并标记了几个有趣的蛋白
Fig.1.B 主成分分析(PCA)可很好地区分3个NK-NPC和3个正常鼻咽组织之间的差异表达蛋白。
Fig.1.C 对 161 种差异表达蛋白进行 KEGG 富集分析。
Fig.1.D 蛋白热图显示,富集在自然杀伤细胞介导的细胞毒性通路中的DE蛋白在NK-NPC组中显著下调,包括PRKCB、PTPN11、LCK、ITGAL、PIK3CB、CASP3和MAPK3。
4.3 GSE162025的scRNA-seq分析
1 |
|
Fig.2.A NK-NPC单细胞图谱。通过降维和聚类 79,000 个细胞获得了 19 个簇。
Fig.2.B 19个簇通过其各自的标记基因被识别为不同类型的细胞:上皮细胞、T细胞、NK细胞、髓样细胞和B细胞。
Fig.2.D 10 个样本中每个样本中细胞类型比例的条形图
4.4 NK细胞亚型分析和衰竭情况
1 |
|
Fig.3.A 通过NK细胞的降维和聚类获得NK1-4细胞亚群
Fig.3.B scRNA volcano
Fig.3.C GSEA结果显示,NK1亚群激活了自然杀伤细胞介导的细胞毒性。NK2,NK3不再重复复现过程。
4.5 NK细胞亚群细胞通讯分析
1 |
|
Fig.3.F 肥大细胞和 NK1-3 亚群之间的细胞间相互作用。
4.6 NK细胞耗竭标志物的表达
1 |
|
Fig.3.G 细胞耗竭标志物的表达:NK1-3亚群中HAVCR2、TIGIT、LAG3和CTLA4,其中NK3的TIGIT和LAG3表达最高,HAVCR2和CTLA4的部分表达。此外,NK3 的 ZNF683 表达最高。
4.7 GSE150825鼻炎淋巴增生分析
1 |
|
Fig.3.I GSE150825数据集中的NK细胞被缩小并聚类为五个细胞亚群,NK1-5。
Fig.3.J NKG7、ZNF683、TIGIT、HAVCR2、LAG3和CTLA4在NK1-5亚群中的表达,其中NK-NPC的NK3亚群中ZNF683、TIGIT和LAG3的表达相对较高。
Fig.3.K 数据集没有找到对应的分组信息,找不到NLH组和NPC组。
4.8 对NK-NPC 单细胞谱进行全局细胞间通讯测定
1 |
|
Fig.4.A 所有细胞类型之间关于半乳糖凝集素信号传导的细胞间相互作用。
Fig.4.B Epi1-7 细胞亚群是通过上皮细胞的降维和聚类获得的。
Fig.4.C copykat软件识别良恶性上皮细胞,橙色代表拷贝数增加,蓝色代表拷贝数缺失,上面穿插的灰色和黑色代表不同的染色体;Pred.Aneuploid:恶性;pred.diploid:良性。
Fig.4.D copykat 软件进一步将恶性肿瘤细胞识别为两种亚型,即肿瘤亚型 1 和肿瘤亚型 2。
Fig.4.E 肿瘤亚型 1 和肿瘤亚型 2 两种亚型在 TNSE 图中绘制。
Fig.4.F LGALS9 和 MHC I 类分子在肿瘤亚型 1 和肿瘤亚型 2 中的表达。
Fig.4.G KRT5、SSTR2、LMP-1/BNLF2a/b和RPMS1/A73在肿瘤亚型1和肿瘤亚型2中的表达和分布。
4.9 NK-NPCtumor1 亚群细胞进化轨迹和功能富集分析
1 |
|
Fig.5.A Epi T1-4 细胞亚群是通过肿瘤亚型 1 亚群的降维和聚类获得的。
Fig.5.B 考虑到EBV活性状态对tumor1可能有影响,于是把tumor1单拎出来进行拟时序分析,这里就随便选一个亚群了。
Fig.5.B 拟时序分析,肿瘤亚型1的细胞进化轨迹:从0到1的时间,上皮细胞进化轨迹方向从Epi T1-Epi T4,对应全局基因表达变化。红色表示高表达,蓝色表示低表达。
Fig.5.C Epi T1-4 亚群的标记基因
Fig.5.D Violin 图显示了 Epi T1-T4 亚群中 KRT5、VIM、SSTR2、LMP-1/BNLF2a/b、RPS18 和 RPS23 基因的表达及其变异变化。
Fig.5.E 亚群各标记基因的 GSEA 富集分析。
5 结论
综上所述,本研究揭示了NK-NPC的NK细胞耗竭情况。肿瘤细胞可能通过产生与NK细胞表面的抑制性受体结合的负配体来诱导NK细胞的功能抑制和耗竭。此外,肿瘤细胞可能通过NK-NPC中LGALS9的表达来抑制NK细胞的功能。本研究首次进一步确定了NK-NPC中EBV活性状态下肿瘤细胞的独特进化轨迹。我们的研究结果为不同阶段的肿瘤监测提供了潜在的治疗靶点和可能的生物标志物,从而提高了NK-NPC患者的生存率。然而,还需要进一步的功能实验来研究潜在的机制。
6 复现心得
-
RDS vs. RData vs. RDA:
格式 用途 优点 缺点 RData 保存整个 R 环境 快速加载和保存整个 R 环境 文件大小大 RDA 保存单个 R 对象 储存大型对象有效 只保存单个对象 RDS 保存二进制序列化的 R 对象 文件大小小,加载速度快,跨平台兼容 只适用于 R 对象 -
当某一流程为限速步骤时,最好能将结果对象保存为文件,以便需要时可再次读入。
-
Seurat对象中储存了关于这个单细胞项目的几乎所有信息,包括每个细胞的barcodes,原始表达矩阵以及运行过哪些分析等,后续对单细胞的分群注释等信息都是保存在Seurat对象中的。在R中可以使用str()函数查看数据结构。