CHY Blog

You are capable of wonderful things.

一个RNAseq完整数据分析脚本

无参转录组的分析案例

使用 hisat2 比对,featureCounts 进行 reads 计数,使用 DESeq2 包进行定量。从测序数据比对,到得到差异表达基因,再到对差异表达可视化以及对差异表达基因进行功能注释。 准备工作 准备工作主要分成三部分,安装生物软件,下载对应的参考序列以及 gtf 文件,以及安装 R 相关的包。 1 软件安装 conda install -y hisat2 subread...

生信零散知识点

收集生信相关各方面知识点

生信知识点 如何利用 NCBI 提取特定位置的基因组序列? Docker 的介绍 没有 docker 我真的不想动这样的生信软件 GO、GSEA 富集分析一网打进 对 miRNA 进行 go 和 kegg 等功能数据库数据库注释 火山图自定义展示 Markdown 数学公式语法 如何系统分析一个基因家族的功能? Review:5.ceRNA 证据与争议 Pathview 包:整合表达谱数据...

基因家族分析

基因家族分析具体流程

本文主要介绍一些 pfam 数据库及基因家族分析相关的基础知识,便于更好的解决基因家族分析有关的问题。 基因家族是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。 pfam 介绍 如何在 pfam 中下载 hmm 文件 搜索进入到蛋白保守结构域的主页,点击右侧的 Curation&mode...

财富自由

财富自由读书总结

念念不忘,必有回响。只要百分之百确信自己可以找到方法、实现目标,蓦然回首你已到达成功的彼岸。 整本书的语言比较易懂,通过调研财富自由者得出作者的结论,虽然某些方面不太赞同,但是整体对自己的财务观念以及性格提升都有帮助。 就像书中总结的那样主要有以下几点: 不轻信财富传说,不轻信一夜暴富 收入与净资产是两回事 白手起家,创造财富是存在极大可能性的,但是充满障碍 近朱者赤,近...

Smart-seq2分析

单细胞Smart-seq2数据分析详解

由于 Smart-seq2 建库测序与 10X 存在较大差异,所以在数据分析(主要是前期表达矩阵的获取)存在一定差异,故借着生信星球推文进行分析流程整理。 数据说明 使用的是来自永生化小鼠骨髓祖细胞系的 2 个 96 孔板的 416B cells,并且在细胞裂解后文库制备前,在每个细胞中加入一定量的外源 RNA(ERCC),之后再进行高通量测序,得到每个基因的表达量(这个是通过计算比对到...

Mutational Signatures分析

吸烟机电子烟测试潜在分析方向

近期拟定开展电子烟相关测试研究,但整体课题设计较为粗略,需要积累相关可研究热点,提升文章高度。烟气处理相关突变定是后续研究热点,考虑到电子烟处理可以不用进行稀释,那么细胞处理的污染性大大降低,以达到长期处理的可能性。 知识主要整理于医学统计园公众号,仅作个人学习使用。 Mutational Signatures 简介 人体细胞中基因的突变可分为两种: Somatic Mutation ...

单细胞零散知识点

收集单细胞相关各方面知识点

本次 Markdown 主要记录一些单细胞相关的小知识点,包括样品制备、分析流程等等。 样品制备 Visium 空间基因表达解决方案-样本冰冻包埋指南 Visium 空间基因表达解决方案-冰冻切片制备指南 cellranger cellranger 结果判断 数据分析 提高单细胞测序自动化注释准确性的关键因素:reference 标签完整性 TooManyCells–单细胞聚类分...

TooManyCells教程

scRNA-seq数据分析绘图

TooManyCells 算法有 2 种包装形式,一种是 too-many-cells 软件,一种是 TooManyCellsR R 包。 TooManyCells 方法原理 TooManyCells 通过递归技术反复识别在树结构中亚群,其可视化模型结合一系列可视化特性为细胞状态提供一个灵活的平台,跟踪、探索和检测稀有种群。除了聚类和可视化之外,TooManyCells 还提供其他功能,...

空间转录组

单细胞空间转录组学习笔记汇总

10x Visium 应用 虽然空间转录组概念很早就被提出,但是商业化的产品最近才开始应用,相信在以后的发展中将得到越来越多的应用。 空间基因检测技术汇总 空间基因检测技术目前以 RNA/蛋白质为检测对象的技术有下图展示的 9 种。圆点表示检测对象是 RNA,三角形表示蛋白。不同颜色代表不同的分辨率,红色代表比较精确的单细胞水平。可以从图中看出,单细胞水平的多基因检测技术只有seqF...

Machine learning

周志华《机器学习》西瓜书学习笔记

周志华《机器学习》西瓜书学习笔记。持续更新 绪论 机器学习:在计算机上从数据中产生“模型”的算法,即“学习算法”。 数据集:指记录的集合。 记录:关于一个事件或对象在某方面的表现或性质的事项。 属性(特征); 属性值 属性空间/样本空间/输入空间:属性张成的空间 每个记录都可在属性空间中找到自己的坐标位置,对应一个坐标向量,称为“特征向量”。 学习 learning/训练 trainin...