CHY Blog

You are capable of wonderful things.

bamtofastq使用

10X单细胞数据如何从Bam转回Fastq

详细链接:https://support.10xgenomics.com/docs/bamtofastq bamtofastq是10X官方专门开发的针对cellranger, cellranger-atac, cellranger-arc, cellranger-dna, spaceranger or longranger等软件生成的Bam倒推出fastq文件的工具。BAMs produ...

基因组注释文件转换

几种gff/gtf文件格式转换方法

多种方法用于转换gff和gtf文件 第一种:gffread gffread my.gff3 -T -o my.gtf gffread my.gtf -o- >my.gff3 第二种: NBISweden/AGAT(安装perl模块有点繁琐) conda install -c bioconda agat conda install -c bioconda perl-sort-natur...

物种间同源基因分析

多种方法获取不同物种间的同源基因

对于一些非模式物种,尤其是对于植物领域的研究来说,在没有很好的注释等背景信息的提供,对于生信相关的研究也是很为难的。所以在此记录一下,目前存在的多种方法用于探究物种间的同源基因分析。 第一种:biomart https://www.ensembl.info/2009/01/21/how-to-get-all-the-orthologous-genes-between-two-species...

单细胞相关数据库

收集整理单细胞相关的数据库

hemberg-lab/scRNA.seq.datasets This website contains a collection of publicly available datasets used by the Hemberg Group at the Sanger Institute. 包含小鼠和人的多个组织。 10x Genomics 单细胞转录组数据库 10x Genomics...

单细胞知识点细节

单细胞分析过程中遇到的知识点细节

本文主要记录一些为提升单细胞分析能力的知识点,应用于单细胞的一些高级分析。 Pseudocell概念 为了从高通量单细胞mRNA数据中增加基因数量和基因表达相关性,从同一细胞群中的多个细胞中收集数据,制作假细胞(Pseudocell)用于网络解释。Pseudocell概念是为了弥补稀疏矩阵在计算相关性上的缺陷,毕竟零值太多,影响相关性的计算。 Pseudocell概念常是将单细胞数据应用于...

biopython

python中的生物信息学分析

本节主要记录biopython库的学习,学习资源来自于生信修炼手册公众号,仅做个人学习使用。 biopython简介 biopython可用于常规的生信分析处理: 对常用的文件格式,比如fasta, blast等,进行读写 对blast, clustalw等常用软件的集成 对NCBI, SwissPort, PDB等常用生物信息学数据库的检索和解析 进化树的构建 基因...

Salmon

基于Salmon的转录组定量流程

Salmon是不基于比对计数而直接对基因进行定量的工具,适用于转录组、宏基因组等的分析。 优势在于: 定量时考虑到不同样品中基因长度的改变(比如不同isoform的使用) 速度快、需要的计算资源和存储资源小 敏感性高,不会丢弃匹配到多个基因同源区域的reads 可以直接校正GC-bias 自动判断文库类型 ``` 第一步:构建索引 ENSEMBL下载基...

细胞互作交流

从基因表达解读细胞之间的相互作用和交流

目前单细胞转录组技术的快速发展,关于单细胞转录组数据的应用也越来越宽泛,其中细胞相互作用的探索尤为重要。 细胞互作存在多种形式 自分泌信号转导是指细胞内通讯,细胞分泌配体,这些配体用于通过同源受体诱导同一细胞上表达的那些分子的细胞应答。 旁分泌细胞间的通讯不需要细胞间的接触,而是取决于信号分子在分泌后从一个细胞扩散到另一个细胞。 近分泌,即依赖于接触的细胞间通讯依赖于间隙...

Bioconductor单细胞分析再学习

Orchestrating Single-Cell Analysis with Bioconductor

关于单细胞分析的内容,还存在许多的细节问题还没有思考明白,比如说细胞注释到底应该如何解决?或者在鉴定差异基因时候如何选择Marker gene?故在此重新学习单细胞分析教程,加深分析内容的理解。 Orchestrating Single-Cell Analysis with Bioconductor Orchestrating Single-Cell Analysis with Bioco...

R--面向对象编程

具体再学习R中S3、S4、RC系统

在单细胞的许多应用以及R包的开发过程中都会涉及到R中对象的概念,所以在此深入学习一下R中对象的概念,具体的是S3/S4/RC类型的学习。 面向对象基础 面向对象的3个特征:封装,继承,多态 封装:是把客观事物封装成抽象的类,并且类可以把自己的数据和方法只让可信的类或者对象操作,对不可信的进行信息隐藏。 继承:子类自动共享父类数据结构和方法的机制,这是类之间的一种关系。在定义和实现一个类的时...