单细胞分析
这涉及将每个细胞的所有计数除以特定于细胞的比例因子,通常称为“大小因子”。这里的假设是,任何细胞特异性偏倚(例如,捕获或扩增效率)均会通过缩放该细胞的预期平均数来同等地影响所有基因。每个细胞的大小因子表示该细胞中相对偏差的估计,因此,将其计数除以其大小因子应消除该偏差。
单细胞分析是一种对单个细胞进行检测和分析的方法,常用于基因组学和转录组学等领域。在单细胞分析中,通常需要将单个细胞分离出来,然后进行核酸提取、建库和测序等步骤。通过对测序结果进行分析,可以获得单个细胞的基因表达、变异和表观遗传等信息,从而用于研究细胞间的差异、细胞发育和疾病发生等过程。
我们使用来自 robustbase 的方法基于它们的QC指标来量化每个细胞的“异常”,然后使用 isOutlier() 来识别表现出异常高水平异常的低质量细胞。 这种方法和相关方法(例如基于PCA的异常检测和支持向量机)可以提供更高的能力,以区分低质量的细胞与高质量的细胞,因为它们可以利用许多QC指标中的模式。
放在我们单细胞转录组的场景下,就是需要将一个 基因×细胞 的表达矩阵(V),分解成 基因×表达程序 (W),与 表达程序×细胞 (H)两个矩阵的乘积。如下图:在 基因×表达程序 矩阵中,存放的是每个program中,每个基因的权重, 往往根据权重最大的前20/30个基因来确定该program的功能 。
在单细胞制备过程中使用商用细胞碎片清除解决方案有助于提高样品清洁度和目标细胞计数的准确性,特别是对于存活率低于70%的细胞制剂[4]。 基于液滴(droplet)的方法: 基于液滴的方法使用了DNA条形码技术对包裹在油滴中的单个细胞进行分析,大大减少了每次分析所需的时间和成本。
如何在单细胞水平上测定某个基因的拷贝数
在统计学上,CopyKAT将贝叶斯方法与层次聚类相结合,计算单个细胞的基因组拷贝数分布,并从高通量单细胞转录组数据中定义克隆子结构。 首先,单细胞转录组数据的Unique Molecular Identifier(UMI)的基因表达矩阵作为CopyKAT的输入,通过它们的基因组坐标对它们进行排序,并对基因的排列进行注释。
基因在染色体上的位置信息文件第一列为gene symbol名称,第二列是染色体号,后两列是基因的始末位置,制表符分隔。格式如下:细胞类型文件的第一列为细胞名,第二列是细胞的分组信息,可以是确定的细胞类型,也可以是细胞的分组编号等等,制表符分隔。
单细胞测序带来数据分析的独特挑战单个哺乳动物细胞包含50,000–300,000个转录本,且各个细胞间的基因表达值存在显著差异。虽然每个单个细胞可表达数十万个转录本,但高达85%的转录本仅有1–100个拷贝。因此,在 scRNA-Seq 中捕获低丰度mRNA转录本并扩增合成的cDNA以确保所有转录本最终在文库中均匀呈现至关重要。
单细胞拷贝数变异(CNV)分析基于单细胞转录组数据,利用不同样本或不同细胞类型之间的基因表达量预测大规模染色体水平的CNVs,发现拷贝数异常的细胞,从而帮助推断肿瘤恶性细胞,为肿瘤异质性、克隆进化的研究奠定基础。
单细胞变异分析,包括SNP(单核苷酸多态性)、Indel(插入/删除变异)和CNV(拷贝数变异)的检测,有助于理解基因组的细微变化。线粒体基因组突变热图,标记出重要变异区域,提供更深入的基因组学洞察。
单细胞测序扫盲:是什么?为什么?怎么做?
1、首先将单细胞悬液样品和带有barcode的水凝胶珠子,通过微流体芯片,包裹在一个油滴之中。在油滴中进行逆转录之后,每一个单细胞的cDNA文库,就带上了独一无二的barcode了(蓝色部分)。最后,我们再将所有的单细胞cDNA文库混在一起测序,再通过程序识别barcode,区分单细胞。
2、传统的基因测序方法(Bulk RNA-seq)是对组织进行的检测,得到的结果是所有细胞的平均值,会忽略细胞之间的差异性,比如有的细胞转录水平比较高,有的细胞则比较低。同时如果目标细胞占比本来稀少,则这些细胞的信息会被平均或覆盖掉。
3、在细胞分裂过程中,当双螺旋解旋后,两条染色体上的遗传信息偶然会出现交换,如果这样的交换水平不断提高,就标志着出现了DNA损伤和癌症。传统的基因组测序,由于在单细胞DNA扩增和测序的时候,会丢失定向信息,难以检测到基因重排,因此也就检测不出这一点。
4、然而在制备原生质体的过程中,通过过滤去除破碎细胞中的小碎片和细胞器,然后通过流式细胞仪进入10xGenomoics系统制备文库,然后利用Illumina平台测序,分析了来自三个独立重复的12525个单细胞,检测了28899个基因的表达, 与普通转录组的基因表达检测情况相当。使用MetaNeighbor进行细胞聚类,共将其聚成12个类别。
5、单细胞DNAseq的意义:相比前者共识较少。但是首先我们要知道其实一个个体的所有细胞并不是拥有绝对相同的基因组: 极体的例子其他答案有提,我就不做赘述。