CHY Blog

You are capable of wonderful things.

SCENIC网络分析

植物单细胞网络分析可行性

高歌课题组绘制完成 63 种植物功能性转录调控图谱 PlantTFDB – Plant Transcription Factor Database 植物转录因子数据库【planttfdb】的使用 植物比较基因组学和数据库 SCENIC 分析的主要目的是:把单细胞转录组数据结合motif数据库,去构建每个cluster的细胞的regulons,得到每个细胞的regulon activity ...

GO_KEGG信息获取

基因ID及GO KEGG信息获取

多种方式获取基因对应所在 GO term 信息 获取所有基因对应的 GO 注释信息。以水稻为例 # 从NCBI Gene 数据库进行下载 # ftp://ftp.ncbi.nih.gov/gene/DATA/ # gene2go就是基因对应的GO注释文件,这个文件包含了所有物种的GO信息,可以根据物种对应的tax id提取指定物种。 # NCBI中用Entrez Id 标识每个基因,通过...

biomaRt

基因ID多形式转换

biomaRt 包学习,在做转录组分析中常见的就是 ID 转换,最基本的 gene id,各个数据库又存在不同的 ID,如 Entrez ID 等等。 biomaRt 是基因所有类型转换工具。 基本操作 ## 第一步:提前设置想要使用的数据库 useMart(biomart, dataset, host="www.ensembl.org", path="/biomart/mart...

Cell Blast

Cell blast比对注释分析流程

Cell blast 比对注释 import time import warnings import numpy as np import pandas as pd import tensorflow as tf import Cell_BLAST as cb warnings.filterwarnings("ignore") np.set_printoptions(threshold=...

普通转录组脚本

普通转录组脚本更新

普通转录组分析流程脚本更新 Shell # 质控 nohup fastqc -o /data2/chy/Rice/rawdata/dml4_3 DML4_C1_Clean_Data1.fq.gz DML4_C1_Clean_Data2.fq.gz & # hisat2比对 # 安装 wget http://ccb.jhu.edu/software/hisat2/downloa...

哈佛大学单细胞课程

针对单细胞基础分析深入学习

记录学习哈佛单细胞数据分析课程笔记。 单细胞分析优势及特点 单细胞分析可以解决的问题: 探究组织中存在的细胞类型 鉴定未知的或稀有的细胞类型 探究发育过程中基因表达差异 不同环境下不同类型细胞的表达差异 空间转录组表达信息探索 单细胞分析存在的挑战: 数据量过大 每个细胞对应测序量过低(often detecting only 10-50% of ...

R语言可视化

R语言基础可视化绘图脚本

根据 bioinformics 公众号整理,主要收集 R 语言绘制基本图形的脚本便于后续科研使用,仅做个人学习使用。 散点图 # 清除当前环境中的变量 rm(list=ls()) # 设置工作目录 setwd("C:/Users/Dell/Desktop/R_Plots/01scatterplot/") # 读取示例数据 data <- read.table("demo_scatt...

无参转录组分析流程

潜在无参转录组在单细胞中应用

研究步骤 构建cDNA文库,采用Hiseq 2000 PE100或Hiseq 2500 PE125测序手段,现已升级为Hiseq 4000 PE150测序手段。 利用Trinity软件对clean reads进行混合拼接,得到transcript和其中的unigene。 对transcript和unigene进行功能注释,依据Nr、Nt、Swiss-prot、pfam、KOG、...

细菌基因组分析

一个细菌基因组完整分析流程

基于基因学苑公众号的推送内容,将生信相关内容收集整理,便于后续查阅,仅做个人使用。 数据质控 利用 fastqc 软件对原始测序 reads 进行指控. mkdir result fastqc -f fastq -o result 130801_I249_FCC2BDTACXX_L4_SZAIPI030696-112_1.fq.gz 130801_I249_FCC2BDTACXX_...

人全基因组分析

一个人全基因组完整分析流程

基于基因学苑公众号的推送内容,将生信相关内容收集整理,便于后续查阅,仅做个人使用。 人全基因组分析可以大致分为四个过程。 从 DNA 到 fastq; 从 fastq 到 bam; 从 bam 到 vcf; 从 vcf 到 pdf; 从 DNA 到 fastq 从 DNA 到 fastq 也就是测序的过程,对于人全基因组的测序,要分清楚几个问题? 1、选择哪种测序...