植物单细胞类型注释

Hello single cell

Posted by CHY on January 5, 2020

单细胞数据分析中最为关键的一步就是细胞类型注释,后续相关分析均是基于注释结果进行,但是由于植物相关研究不多,相对于动物尤其是人来说,相关基础知识较少。根据目前已经发表的植物单细胞文章来看,主要包含三种方法,整理如下:

(1) Marker gene鉴定 这种方法也是最简单的方法,但主要取决于是否存在对应的Marker gene列表,目前的植物单细胞文章全是基于拟南芥根尖而言,大多是因为拟南芥作为模式植物,根尖各细胞类型已经鉴定出大量的Marker gene。利用Seurat中的VlnPlot()和FeaturePlot()函数便可绘制对应的表达图。

VlnPlot(ara_integrated, features = c("AT4G12520", "AT4G22666"))
FeaturePlot(ara_integrated, features = c("AT4G12520", "AT4G22666"),cols = c("lightgrey", "red","red"))

(2) bulk RNA数据关联分析 通过将聚类的每个簇的平均基因表达值与bulk RNA的表达值(选取每个细胞类型的前50%最易变的基因)进行比较而得出的Spearman的相关系数。

(3) ICI algorithm 评估数百种基因的表达,以计算单个细胞属于特定拟南芥根细胞类型并返回最佳细胞类型匹配的概率。 使用自举置换方法(1000次迭代)估算与单元类型分配相关的概率,并使用Benjamini-Hochberg方法进行调整。文献参考 具体分析方法还有待学习。

细胞类型注释是单细胞数据分析最重要的分析步骤之一,需要多理解学习,需要结合多种方法来验证注释的可靠性,也是后续分析的保障。