CHY Blog

You are capable of wonderful things.

R命令

R 命令用法及其主要参数设置

本篇 Markdown 主要记录一些常用的 R 命令及其主要参数设置。 基础命令 object.szie # 获取变量大小 object.size(letters) object.size(ls) # 不同显示方式(KB/MB) sl <- object.size(rep(letters, 1000)) print(sl) ...

机器学习

StatQuest机器学习总结

本节主要记录StatQuest中机器学习部分的内容。 机器学习基础简介 一般来讲,机器学习就是进行预测和分类。 通过训练数据集训练模型,然后使用测试数据集验证模型的好坏。 交叉验证 交叉验证使我们能够比较不同的机器学习方法并对这些方法在实践中的表现有所了解。 为机器学习方法估计参数(训练算法) 评价选择的方法是否能够很好地对新数据进行分类(预测)(测试算法) 一般是将前75%的...

Shiny

R语言app构建

Shiny用于开发交互式web应用。 Shiny应用程序分为两个部分:用户界面定义和服务端脚本。 用户界面是在源文件ui.R中定义。 服务端脚本在server.R中定于。 # 安装 install.packages("shiny") library(shiny) runExample("01_hello") # 示例1 runExample("02_text") # 示例2 ru...

单细胞WGCNA

单细胞转录组WGCNA应该如何做?

加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品(单细胞中为cell-barcode)之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定marker gene 或治疗靶点。 参考链接:https://mp.weixin.qq.com/s/z0...

StackedVlnPlot

R语言实现单细胞StackedVlnPlot图

小提琴堆叠图是单细胞分析中常用于展示Marker gene表达的方式,简单直观,这里记录一下几种绘制小提琴堆叠图的方法。 R原生函数实现StackedVlnPlot library(Seurat) library(ggplot2) # 构建函数 modify_vlnplot<- function(obj, feature, ...

ILoReg

单细胞rare cell鉴定分析

ILoReg并不像常规分析流程一样通过选择feature来进行降维,而是采用probabilistic feature extraction,利用ICP算法运行多次,生成多个概率矩阵(N x K,N指细胞数,K指每个细胞属于特定cluster的概率)后最终联合成一个矩阵,再进行PCA分析将维度将至二维。输入文件为根据文库大小标准化后的数据,with genes/features in row...

GiniClust

单细胞rare cell鉴定分析

GiniClust3是专门开发用于rare cell type鉴定的软件,它主要通过Gini index来鉴定与rare cell type相关的基因。基于a cluster-aware, weighted consensus clustering approach,他将Gini index和Fano factor的结果进行整合来鉴定rare cell type. import scan...

dropClust

大规模单细胞数据聚类分析

dropclust方法是用于针对大规模单细胞数据进行聚类分析的算法,采用局部敏感哈希(LSH)的方法去找到细胞的Nearest Neighbour(加速聚类的过程)。然后使用这些Neighbour的信息,提出了一种细胞采样的方法Structure Preserving Sampling (SPS) ,使得细胞数量较少的那些类别被采样到的比率会相对比较大,降低由于采样而导致的聚类精度损失。提出...

FiRE

单细胞rare cell鉴定软件

FiRE通过为每个细胞计算rareness/outlierness score来鉴定rare cell。为了计算邻近度,FiRE使用了Sketching算法。 Github: https://github.com/princethewinner/FiRE Example ## L <- number of estimators ## M <- Number of dims t...

Pandas

Python中Pandas库的学习

本节主要记录 Python 中 Pandas 库的学习过程,以生信修炼手册和官方文档为基础。 初识 pandas 在 pandas 中,提供了以下两种基本的数据结构 Series 和 DataFrame,Series 相当于 R 中的向量,DataFrame 相当于数据框。 pandas 中的缺失值用 NaN 来表示。 import pandas as pd s = pd.Series...