Clear Sky Science · zh
SexTumorDB:基于单细胞分辨率的性别依赖性肿瘤全景综合资源
为何男性与女性罹患不同的癌症
临床医生早已注意到,男性与女性在癌症的发生和进程上并不相同。有些肿瘤在男性中更常见,有些在女性中更常见,且对相同治疗的反应也常有差异。然而,多年来大多数癌症研究往往将两性视为可互换的。本文介绍了SexTumorDB——一个新的开放数据库,它允许科学家以人类肿瘤中数百万个单个细胞为对象,深入揭示生物学性别如何在体内塑造癌症特征。

逐细胞描绘肿瘤的新地图
SexTumorDB并不把肿瘤视为均质团块,而是将其拆解为超过两百万个单细胞。这些细胞来源于532份样本,涵盖13种常见的非生殖器官相关癌症,例如肺、肝、结肠、膀胱和脑肿瘤。每个细胞都携带了基因表达的读数,研究者因此不仅能看到肿瘤细胞,还能识别出免疫细胞和包围肿瘤的基质细胞。关键在于,每个样本都关联有供体的性别信息,使该数据库成为研究基于性别差异的强大工具。
谨慎筛选以避免隐性偏倚
为了构建可信的资源,研究团队首先全面梳理了公开的癌症研究并制定了严格的入库标准。他们要求提供单细胞或单核RNA测序数据、明确的供体性别记录、来源于原发肿瘤部位的样本,以及未接受治疗的患者样本,以避免药物干扰导致的变化。为减少不同研究间的技术差异,他们还优先选择一种广泛使用的测序平台。经过这些筛选,团队跨多个器官和疾病类型汇集了数据,包含肿瘤及其邻近或健康组织,并剔除了不符合质量标准的样本。

将原始数据转换为通用语言
研究者随后将所有数据集通过统一的处理流程,以便来自不同医院和研究的细胞可以直接比较。他们质控每个细胞,滤除受损或不明确的细胞,并统一基因命名。利用专门软件纠正技术性批次效应,并将细胞投影到点图中,每个点代表一个单细胞。在此基础上,团队施行了三级标注体系:每个细胞首先被标记为肿瘤、正常、免疫或基质(支持)细胞,然后归入33个主要类型,如T细胞、成纤维细胞或上皮细胞,最后根据原始研究或专家人工审阅补充更详细的亚型注释。
确保性别与恶性状态的准确性
由于性别是数据库的核心,作者并未单纯信任原始研究的性别标签,而是进行了复核。他们利用在男性与女性中表现不同的已知基因,包括位于Y染色体的基因以及主要在女性细胞中活跃的XIST基因。在全部数据集中,男性样本显示出预期的Y连锁特征,而女性样本表现出强烈的XIST活性,这确认了性别标注的正确性。为将真正的恶性肿瘤细胞与外观相似的正常细胞区分开来,他们应用了轻量级的机器学习工具,并将结果与现有标签进行比较,发现高度一致,从而进一步提高了数据的可靠性。
面向全球科学家的工具
考虑到并非每个实验室都拥有强大的计算资源或专业程序员,团队制作了更轻量的降采样数据版本并构建了交互式网络应用。这些在线工具允许用户按区室浏览肿瘤、免疫与基质细胞,直观显示男性与女性患者间的细胞类型差异,并下载标准化的数据集和元数据。整个资源及其处理代码已通过公共仓库免费开放,便于他人复现或扩展该工作。
对未来癌症治疗的意义
SexTumorDB本身并不直接提供新药或治愈方法,但它为尊重男性与女性生物学差异的治疗策略奠定了基础。通过提供对数百万单细胞在男性与女性肿瘤中行为的清晰、统一视角,该数据库帮助研究者定位癌细胞及其周围免疫系统的性别特异性薄弱环节。随着时间推移,从该资源得出的发现可能指导更有针对性的筛查策略和治疗方案,使癌症护理朝着真正的个体化医疗迈进——将性别作为重要考量而非事后补充。
引用: Sun, R., Deng, Q. & Wang, D. SexTumorDB: a comprehensive resource of sex-dependent tumor landscape at single-cell resolution. Sci Data 13, 520 (2026). https://doi.org/10.1038/s41597-026-06707-4
关键词: 癌症的性别差异, 肿瘤微环境, 单细胞RNA测序, 癌症数据库, 精准肿瘤学