admin
作者热门文章
NBT | 夏铮团队开发“剪刀”算法来利用批量数据去引导从单细胞数据中识别与临床和生物表型最相关的单细胞亚群
2021-11-12

单细胞测序技术可以从微环境异质组织中区分各类细胞类型和状态,正在改变当前的生物医学研究和临床应用。标准的单细胞数据分析使用无监督聚类方法来定义多达数十个细胞类型,检查每个类别的标记基因,并评估标记基因在已知细胞类型和通路中的富集程度,以评估每个细胞类别对所感兴趣的表型的重要性。基于聚类的方法容易受到选择的方法和参数的影响,而且先做单细胞聚类的分析方法割裂了这个“cell-to-phenotype”的过程,不能直接将单细胞与特定感兴趣的表型直接联系起来。另外,单细胞技术本身还没有对各类广泛的表型进行专门的大规模应用。大多数单细胞实验只针对研究的特定一个表型涉及几十例样本,缺乏足够的统计能力来识别驱动表型的细胞亚群。然而,识别与各类多样化的表型如疾病分期、肿瘤转移、基因变异、治疗反应和生存结果相关的细胞亚群对促进细胞类型靶向治疗以及预后生物标志物的发现有重要作用。与此同时,通过长达数十年的努力,生物和临床表型信息已经在大规模的批量临床样本组织中进行了非常丰富的病理注释。批量测序数据及其对应的表型数据可以从像癌症基因组图谱 (TCGA) 这样的公共大数据集上广泛获得。利用这种广泛可及和有表型注释信息价值的批量测序数据来指导从单细胞数据进行细胞亚群鉴定具有重大的意义。

 

2021年11月11日,美国俄勒冈健康与科学大学计算生物学组的夏铮团队在Nature Biotechnology上发表了题为 Identifying phenotype-associated subpopulations by integrating bulk and single-cell sequencing data 的研究文章,开发了 SCISSOR“剪刀”算法从一个新的角度来分析和挖掘单细胞数据。

 

 

通过利用批量数据及其注释的各类表型信息,该算法自动从单细胞数据中选择对表型差异最重要的细胞亚群。SCISSOR首先通过量化每个单细胞和每个批量样本之间的相似性来整合表型相关的批量测序数据和单细胞数据。

 

然后,研究人员设计了一个基于样本表型相关矩阵的回归模型并整合了稀疏性和细胞之间的相似性网络。通过优化这个回归模型,SCISSOR可以识别与感兴趣的表型最相关的的细胞亚群。SCISSOR在仿真数据和区分肿瘤和正常细胞中取得了很好的效果。

 

在应用于肺癌单细胞基因表达数据集,SCISSOR能够识别与较差生存率和TP53突变相关的细胞亚群。在黑色素瘤中,SCISSOR发现了一个与免疫治疗反应正相关的低PDCD1/CTLA4和高TCF7表达的T细胞亚群。除了癌症中的应用,SCISSOR在肌肉疾病和阿尔茨海默病单细胞数据集分析方面也很有效。

 

SCISSOR的新颖之处在于它利用大量存在的表型信息通过批量数据这个“桥梁”从单细胞数据中识别与表型最高度相关的细胞亚群。这就为利用广泛可用的临床表型信息来从单细胞数据中发现细胞靶点的疾病相关细胞亚群打开了大门。

 

 

原文链接:

https://doi.org/10.1038/s41587-021-01091-3

参与评论0条
友情链接: 国家药品监督管理局
@2019 BIOART.COM ALL RIGHTS RESERVED.沪ICP备18041007号
评论
120