简介
单细胞转录组测序(scRNA-seq)作为解析细胞异质性的核心技术,能够在单个细胞水平上捕获基因表达谱,为生命科学研究及临床应用提供了高分辨率的分子层面视角。以下从技术原理、关键流程、数据分析及应用方向等方面进行详细说明。
一、技术背景与核心优势
传统 bulk RNA-seq 基于细胞群体的基因表达平均水平进行分析,难以捕捉细胞间的异质性。而scRNA-seq可实现单个细胞的转录组检测,其核心优势体现在:
1. 能够识别组织中低丰度细胞类型(如肿瘤微环境中的癌干细胞);
2 解析细胞分化轨迹及动态基因表达变化;
3. 揭示基因表达的随机性及细胞状态转换机制。
该技术已成为肿瘤学、发育生物学、神经科学等领域的关键研究工具。
二、核心技术原理与流程
(一)单细胞捕获
单细胞捕获是scRNA-seq的首要步骤,需满足高捕获效率、低交叉污染的技术要求。目前主流技术包括:
1. 微流控芯片技术(以10×Genomics Chromium系统为例)
原理:利用微流控通道将单细胞、带有条形码(Cell Barcode)及UMI(Unique Molecular Identifier)的凝胶微珠与反应试剂包裹于油包水液滴(GEMs)中。
技术参数:单次实验可捕获500–100,000个细胞,捕获效率达65%±5%,双细胞率<0.4%(细胞浓度在700–1200 cells/μL条件下)。
2. 其他捕获方法
流式细胞分选结合孔板接种:适用于低通量需求(<1000细胞),需严格控制细胞活性(活细胞率>90%)。
微滴式数字PCR平台:如Drop-seq技术,成本较低但捕获效率相对较低(约20%–30%)。
(二)RNA 逆转录与cDNA扩增
1. 逆转录反应:细胞裂解后释放的RNA与微珠表面的寡核苷酸引物结合,引物包含:Poly (dT)序列(靶向mRNA的3'端 Poly (A) 尾)、Cell Barcode、UMI 及测序接头序列。逆转录酶(如MMLV逆转录酶)催化合成cDNA第一链,UMI 在此过程中与每个mRNA分子特异性结合,用于后续定量校正。
2. cDNA 扩增:采用PCR扩增或体外转录(IVT)线性扩增:PCR扩增适用于多数平台,需控制循环数(通常12–18个循环)以减少扩增偏倚;IVT线性扩增可降低偏好性,但产量相对较低。
3. 质量控制标准:扩增后cDNA浓度需达到5–30 ng/μL,片段分布峰值在1000–2000 bp(Agilent 2100检测)。
(三)文库构建与测序
1. 文库构建
经cDNA片段化、末端修复、加A尾及接头连接后,通过PCR富集构建测序文库。
文库质量要求:片段大小集中在300–500 bp,无接头二聚体,Qubit定量浓度>2 nM。
2. 高通量测序
推荐测序平台:Illumina NovaSeq 6000或NextSeq 1000/2000。
测序深度设计:
①细胞分群及基础分析:50,000–100,000 reads/细胞;
②高分辨率基因表达分析(如稀有细胞类型鉴定):150,000–300,000 reads/细胞。
数据产出要求:Q30碱基比例>85%,均一性误差<10%。
(四)数据分析流程
1. 原始数据处理
数据拆分:基于Cell Barcode将测序数据分配至对应细胞;
质量过滤:去除含N碱基比例>5%、低质量碱基(Q<20)占比>20%的序列;
UMI 去重:通过UMI计数校正PCR扩增偏差,生成基因表达矩阵。
2. 细胞质量控制
检测基因数:排除<200或>6000基因的细胞(排除死细胞或双细胞);
线粒体基因占比:通常<20%(避免细胞凋亡导致的RNA降解干扰);
核糖体基因占比:根据组织类型设定阈值(如免疫细胞通常>30%)。
3. 标准化与降维分析
标准化方法:采用LogNormalize或SCTransform消除测序深度差异;
降维算法:通过主成分分析(PCA)进行特征提取,选取前20–50个主成分用于后续分析;
可视化:使用UMAP或t-SNE算法进行二维投影,保留局部与全局细胞聚类结构。
4. 细胞聚类与注释
聚类算法:采用Leiden算法(分辨率参数通常设为0.4–1.2);
细胞注释:基于已知标记基因(Marker Genes)及参考数据库(如CellMarker、PanglaoDB)进行细胞类型注释,可结合单细胞注释工具(如SingleR)实现自动化注释。
5. 差异表达与功能分析
差异基因筛选:使用MAST、DESeq2等算法,设定阈值(|log2FC|>0.25,Adjusted P-value<0.05);
功能富集:通过GO、KEGG数据库进行通路分析,结合SCENIC等工具预测转录调控网络。
三、技术难点与解决方案
1. 低起始量RNA扩增偏差
问题:单个细胞RNA含量仅 10–30 pg,易导致扩增效率差异及基因丢失。
解决方案:采用UMI标签校正定量偏差;优化逆转录体系(如添加RNA酶抑制剂、使用高保真逆转录酶)。
2. 批次效应消除
问题:不同实验批次的测序数据存在系统性偏差。
解决方案:实验设计:采用统一试剂及操作流程;计算校正:使用Harmony、Seurat Integration等算法进行批次效应去除。
3.稀有细胞类型检测
问题:低丰度细胞(占比<1%)易被聚类算法忽略。
解决方案:提高测序深度至200,000 reads/细胞以上;采用亚群细分算法(如SubCluster分析)。
四、应用领域
1. 肿瘤微环境解析:识别肿瘤浸润免疫细胞亚群(如exhausted T 细胞、M2型巨噬细胞),分析其基因表达特征及与预后的关联。
技术要求:需结合TCR/BCR测序实现免疫细胞克隆型分析。
2. 发育细胞谱系追踪:通过Monocle3等工具重构细胞分化轨迹,鉴定关键分支点及调控基因。
技术要求:需获取时间序列样本或结合谱系示踪技术。
3. 临床样本分析:对穿刺活检样本进行单细胞水平分子分型,指导个体化治疗。
技术要求:样本需新鲜处理(24 h内完成单细胞捕获),或采用单细胞保存液(如10× Genomics Cryopreservation Kit)。
参考文献
[1] https://www.illumina.com.cn/techniques/sequencing/rna-sequencing/ultra-low-Input
-single-cell-rna-seq.html
[2] Zheng G X Y, Terry J M, Belgrader P, et al. Massively parallel digital transcriptional profiling of single cells. Nat. Commun. 8, 14049[EB/OL].(2017)
[3] Macosko E Z, Basu A, Satija R, et al. Highly parallel genome-wide expression profiling of individual cells using nanoliter droplets[J]. Cell, 2015, 161(5): 1202-1214.
[4] Butler A, Hoffman P, Smibert P, et al. Integrating single-cell transcriptomic data across different conditions, technologies, and species[J]. Nature biotechnology, 2018, 36(5): 411-420.
[5] Stuart T, Butler A, Hoffman P, Hafemeister C, Papalexi E, Mauck WM, Hao Y, Stoeckius M, Smibert P, Satija R. Comprehensive integration of single-cell data[J]. Cell. 2019 Jun 13;177(7):1888-902.
QQ交谈