空间转录组

单细胞空间转录组学习笔记汇总

Posted by CHY on July 26, 2020

10x Visium 应用

虽然空间转录组概念很早就被提出,但是商业化的产品最近才开始应用,相信在以后的发展中将得到越来越多的应用。
空间转录组文章

空间基因检测技术汇总

空间基因检测技术目前以 RNA/蛋白质为检测对象的技术有下图展示的 9 种。圆点表示检测对象是 RNA,三角形表示蛋白。不同颜色代表不同的分辨率,红色代表比较精确的单细胞水平。可以从图中看出,单细胞水平的多基因检测技术只有seqFISH+,而目前市场上 10x Visium 的检测单位是直径 55 微米的斑点(spot),spot 间距 100 微米。
空间基因检测技术

一张 visium 空间基因表达玻片上有4个边长为 0.65cm 的正方形区域,可以检测 4 张组织切片。每个捕获区域有 5000 个 spot,每个 spot 相当于单细胞转录组建库中用于结合单个细胞的磁珠,类似于同个磁珠上有相同的细胞 barcode,同个 spot 上也有统一的 spatial barcode。这个 spatial barcode 可以用于后续分析的 spot 空间坐标定位。
空间芯片
空间芯片2
空间芯片3

空间转录组分析流程

分析流程跟单细胞转录组分析流程类似。不一样的地方主要有两点:

  1. 空间转录组免疫组化图片和 spot 的组织坐标信息;
  2. spot 是组织的一个小区域,不一定是单个细胞,所以在聚类后分群鉴定时,不能直接用细胞类型特异的 marker 基因确定细胞类型,可能存在多种细胞类型在同一个 spot 里。 所以空间转录组往往需要组织相对应的单细胞转录组的细胞类型特征做辅助鉴定。如单细胞转录组整合分析,或者基于单细胞转录组特征基因做 deconvolution,获取每个 spot 的细胞类型比例。
    空间转录组分析流程

Seurat 分析流程结果解读

目前 Seurat 已经有 10x Visium 空间转录组的分析流程。

样本细胞类型比例分析方法 deconvolution

一般只需要提供空间转录组表达矩阵和单细胞数据的细胞类型特征基因矩阵。
deconvolution

最基本的细胞类型 deconvolution 方法是基于线性的方法,其基本假设是 spot 每个基因的表达量,由 spot 中每个细胞该基因表达量的累加。基于该假设,就可以计算出每个 spot 的细胞类型比例,以及每个细胞类型的表达量。
线性方法的缺陷:

  1. 不完整细胞产生误差;
  2. 对噪声敏感。 线性方法

目前也开发出多种其他 deconvolution 方法,其中 MIA 和 Giotto 是基于空间转录组设计的方法,而 bisqueRNA/SPOTlight/CIBERSORTx 的设计初衷是解决 bulk 样本的细胞组分问题。所有方法都有一个相同的依赖,就是单细胞转录组的细胞类型特征基因。
deconvolution方法

MIA 原理

MIA 与 GO 富集的思路如出一辙。将单细胞的特征基因作为 GO terms,用空间转录组无监督聚类分群的差异基因做富集即可。 MIA

Giotto 原理

Giotto 类似于 MIA 也是用富集的方法,但富集方法选择多一些。
步骤: 1.获取单细胞转录组的每个细胞类型的特征基因集; 2.选择一种富集方法: PAGE(GSEA);
RANK;
Hypergeometric(GO);

  1. 以 spot 为对象,特征基因集为参考,做富集分析;
  2. 最后每个 spot 可以得到细胞类型比例。
SPOTlight (method based on NMF)

SPOTlight 是基于非负矩阵分解(NMF)和非负最小二乘法(NNLS)做的 deconvolution。
SPOTlight
主要步骤:

  1. 矩阵 V 是单细胞转录组的特征基因矩阵;对 V 做非负矩阵分解,得到 W 和 H。非负矩阵分解的 topic 个数设置为细胞类型的个数。
  2. 取 W 矩阵(genex topic)和空间转录组的表达矩阵 V’做非负最小二乘(NNLS),得到 Spot 和 topic 的矩阵;
  3. Spotxtopic 的矩阵与之前的 H 矩阵(topicx cell)做非负最小二乘,得到 Spot 和细胞比例的矩阵。
bisqueRNA

BisqueRNA 是一种基于回归的方法。首先,需要生成单细胞特征矩阵;然后关联 bulk 转录组的分布,解析 spot 比例。 bisqueRNA

其他

CIBERSORTx 是由 CIBERSORT 发展而来。
scHOT:根据基因表达相关性确定不同空间模块。

空间转录组分析思路和想法

可以开发的新方法:

  1. 结合 HIC 图像的聚类(跟染色剂相关);
  2. 结合空间周围细胞类型的比例分解; 之前介绍几种 deconvolution 的方法都是将单独 spot 为研究对象,没有考虑 spot 的位置。
  3. 更高的解析度:单细胞/亚细胞,多基因。

相关文献

[1]. Dries, Ruben, et al. “Giotto, a pipeline for integrative analysis and visualization of single-cell spatial transcriptomic data.” BioRxiv (2019): 701680.
[2].https://pages.10xgenomics.com/rs/446-PBO-704/images/CN_10x_BR060_Inside_Visium_Spatial_Technology_A4_Digital.pdf
[3]. https://satijalab.org/seurat/v3.2/pbmc3k_tutorial.html
[4]. Moncada R, Barkley D, Wagner F, et al.Integrating microarray-based spatial transcriptomics andsingle-cell RNA-seqreveals tissue architecture in pancreatic ductal adenocarcinomas[J]. NatureBiotechnology, 2020, 38(3): 333-342.
[5]. Elosua, Marc, et al. “SPOTlight: Seeded NMF regression to Deconvolute Spatial Transcriptomics Spots with Single-Cell Transcriptomes.” BioRxiv (2020).
[6]. JewB, Alvarez M, Rahmani E, et al. Accurate estimation ofcell composition in bulk expression through robust integration of single-cellinformation[J]. Nature Communications, 2020, 11(1): 1-11.https://doi.org/10.1038/s41467-020-15816-6
[7]. JewB, Alvarez M, Rahmani E, et al. Accurate estimation ofcell composition in bulk expression through robust integration of single-cellinformation[J]. Nature Communications, 2020, 11(1): 1-11.
[8]. Ghazanfar S, Lin Y, Su X, et al.Investigating higher-order interactions in single-cell data with scHOT[J]. Nature Methods, 2020: 1-8.
[9]. Eng, Chee-Huat Linus, et al. “Transcriptome-scale super-resolved imaging in tissues by RNA seqFISH+.” Nature 568.7751 (2019): 235-239.