CHY Blog

You are capable of wonderful things.

AUCell

AUCell单细胞基因集分析

AUCell 主要用于识别单细胞 RNA 数据中具有活性基因集(gene signatures)的细胞。 AUCell 使用“曲线下面积”(Area Under the Curve,AUC)来计算输入基因集的一个关键子集是否在每个细胞的表达基因中富集。AUC 分数在所有细胞的分布允许探索 signatures 的相对表达。 AUCell 分析步骤 Build the ranking...

热图heatmap

热图heatmap详细绘制脚本

多种热图绘制方法 R 语言中可以用来绘制热图的包和函数: # 1. 基础安装里的heatmap函数 heatmap(x, Rowv = NULL, Colv = if(symm)"Rowv" else NULL, distfun = dist, hclustfun = hclust, reorderfun = function(d, w) reorder...

DropClust

针对大型单细胞数据分析

Motivation 想要解决的问题 基于 Nearest Neighbour Network 的聚类方法,由于涉及到对细胞与细胞两两之间相似度的计算(即把细胞看成是向量,计算向量之间的相似度),往往会造成很大的计算开销。 对细胞进行简单的 Random Sampling 会使得细胞数量较少的那些类别有可能无法被采样,导致最终聚类的精度不够高。(Highly Parallel G...

单细胞基因集富集分析

一个R包完成单细胞基因集富集分析

singleseqgset 是用于单细胞 RNA-seq 数据的基因集富集分析的软件包。它使用简单的基础统计量(variance inflated Wilcoxon 秩和检验)来确定不同 cluster 中感兴趣的基因集的富集。 ## 安装 library(devtools) install_github("arc85/singleseqgset") library(singleseqgs...

Biomarker

生物标志物概念学习

Biomarker 生物标志物概念 生物标志物(Biomarker)是指可以标记系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生的改变的生化指标,具有非常广泛的用途。生物标志物可用于疾病诊断、判断疾病分期或者用来评价新药或新疗法在目标人群中的安全性及有效性。 生物标志物大可分为三类: 1、可随着时间追踪疾病进展和已知临床检测相关的指标。 2、可以探测药物效果的指标。 3、可以作为...

KEGG通路图深入学习

如何看懂KEGG通路图以及其背后的网络关系

KEGG 数据库介绍 KEGG PATHWAY Database(代谢通路数据库); KEGG BRITE Database(分层分类数据库); KEGG GENES Database(基因数据库); KEGG GENOME Database(基因组数据库); KEGG LIGAND Database(配体数据库); KEGG EXPRESSION Databas...

inferCNV

inferCNV原理及在植物单细胞应用可能性

inferCNV 用于分析单细胞 RNA-seq 数据,分析是否存在一定的染色体拷贝数变异 CNV。 工作原理是,以一组”正常”细胞作为参考,分析肿瘤基因组上各个位置的基因表达量强度变化. 通过热图的形式展示每条染色体上的基因相对表达量,相对于正常细胞,肿瘤基因组总会过表达或者低表达。 可以将拟南芥根各细胞类型注释清楚后,选择分生组织与其他细胞类型进行 CNV 分析。 安装 # 安装J...

RcisTarget

RcisTarget

RcisTarget is an R-package to identify transcription factor (TF) binding motifs over-represented on a gene list. 基于转录因子靶基因的 TSS 位点上下游,是否具有该转录因子结合的 motif 富集,将靶基因区分为直接靶基因和间接靶基因,从而保留直接靶基因。 安装 if (!r...

DNA motif分析

DNA motif分析流程原理及软件

在 DNA 或蛋白的同源序列中,不同位点的保守程度是不一样的,一般来说,对 DNA 或蛋白质功能和结构影响比较大的位点会比较保守,其它位点则不是很保守。这些保守的位点就称为“模体(motif)”。motif 最先是通过实验的方法发现的。motif 这个单词就是形容一种反复出现的模式,而序列 motif 往往是 DNA 上的反复出现的模式,并被假设拥有生物学功能。而且,经常是一些具有序列特异性...

单细胞转录组高级分析

单细胞转录组还能分析些什么?

本文主要学习生信会客厅公众号的系列文章为后续单细胞分析提供思路,学习笔记记录于此,仅做个人学习使用。 高级分析一:多样本合并与批次校正 scRNA 数据目前校正批次效应的算法有很多:MNN, CCA+MNN, Harmony, Scanorama, scMerge 等。 在 Seurat 中,将 CCA 与 MNN 算法结合起来,并参考 SNN 算法的理念设计了“锚点”评分体系,不仅...