Squair et al. — Confronting false discoveries in single-cell differential expression
逐细胞 DE "无扰动也能报几百个假 DEG";六个最优方法都先聚合成 pseudobulk;RNAscope 验证 edgeR 5/6 命中 vs Wilcoxon 仅 3/13。→ 这就是 M4"提示性→确证"的正交验证范式(表达信号 + 原位/RNAscope 复核)。
Deep Research · 顶刊生信方法调研
系统调研近 5 年(2021–2026)Cell / Nature / Science 三大主刊及其核心子刊,面向"把滋养层线粒体能量代谢下调从提示性推向确证"的分析目标,逐篇给出可借鉴的方法、工具与统计策略。
✅ 主刊/核心子刊 在指定范围内(Cell/Nature/Science + Nature Methods·Biotech·Genetics·Communications、Cell Systems/Reports/Reports Methods) ◇ 领域外必读 期刊在范围外但方法学必读
【已验证】 经 3 票对抗式核验通过 【已检索】 命中且高相关、DOI 可靠,但本轮未走对抗验证(引用前请二次核对)
本项目的统计地基。以下 6 篇确立"反伪重复 + pseudobulk"共识,4 篇在你指定期刊范围内。
逐细胞 DE "无扰动也能报几百个假 DEG";六个最优方法都先聚合成 pseudobulk;RNAscope 验证 edgeR 5/6 命中 vs Wilcoxon 仅 3/13。→ 这就是 M4"提示性→确证"的正交验证范式(表达信号 + 原位/RNAscope 复核)。
正式提出 differential state 要在样本层推断、让结论外推到样本而非细胞;聚合法(limma-voom/-trend、edgeR)又快又稳,碾压 MAST/scDD。→ M4 逐细胞类型 pseudobulk 的标准框架与代码路线。
量化伪重复:默认 MAST 一类错误达 0.862,加细胞越加越糟;增加个体数才是提功效的正道。→ 论证 n=4v4 的边界,并解释为何靠加队列(后续④)而非加细胞。
平衡评价下 pseudobulk 综合最优,明确"推荐在 scRNA DE 中用 pseudobulk"。→ 作方法学引用背书本项目路线。⚠️ 只引"推荐 pseudobulk"这一结论,别引其 MCC "平衡度量"的具体表述(核验中被否 0-3)。
把首个 AD snRNA(Mathys 2019)重算:FDR<0.05 下 14,274 → 26 个 DEG(少 549 倍)。→ 给审稿人最直观的"为什么不能逐细胞"实证。
数学证明:带正确 offset(每供体细胞级 size factor 之和)的 pseudobulk 与负二项 GLMM 统计性质几乎相同(logFC、方差、p 值校准一致)——前提正是"细胞分组在供体层完全确定"的病例-对照设计。→ 免去跑昂贵 GLMM 堵审稿人;pseudobulk 不是"省事近似"而是等价方案。⚠️ 此前误标作者为 Murphy & Skene,已更正。
竞争性检验必须校正基因间相关(否则一类错误 7–8×);CAMERA 用单一 VIF 校正,极少生物学重复下仍控住一类错误;并厘清自洽 vs 竞争性之别。→ M4 在 pseudobulk 上用 CAMERA + fry/roast 双报。⚠️ n=4 下 CAMERA 偏保守,M4 竞争性不显著 ≠ 无效应。
一个接口打包 11 种活性推断(AUCell/GSEA/GSVA/ULM/VIPER…),给跨方法 consensus 均值 z;R + Python 双端。→ M4↓ 需在 ≥2 种打分器下方向一致才升级。⚠️ "多方法=更准"被否(0-3),只当一致性/收敛效度用。
整合 6 种秩基单细胞打分(AUCell/UCell/singscore/ssGSEA/JASMINE/VIPER),用 Robust Rank Aggregation 聚合出跨方法稳健富集集。→ 单细胞层 M4 的多打分器一致性检验。
ssGSEA/GSVA 在稀疏 scRNA 上有偏,单细胞原生法(AUCell/UCell/JASMINE)更稳。→ 65,828 细胞与 8 片 Visium 的 M4 逐点打分一律用 AUCell/UCell;ssGSEA/GSVA/CAMERA 只留给非稀疏的 pseudobulk 矩阵。⚠️ "bulk 法专门压低下调方向(25/23 vs 6/5)"被否(0-3),别用该论据;该文作者与 JASMINE 有利益关系,优先用独立验证的 AUCell/UCell。
与单细胞并列的优先环节。以下多在你指定期刊范围内,DOI 引用前建议二次核对。
贝叶斯层级去卷积,用 scRNA 参考(即你 65,828/12 类)估每 spot 的 SCT/VCT/EVT 丰度,显式建模批次/检测灵敏度(8 片间校正)。→ 得丰度后做丰度加权的 spot 级 M4 打分,看 M4 是否在 PE 的 SCT/VCT 富集区空间下调;丰度矩阵反过来控构成混杂。(你项目已在用)
45 真实 + 32 模拟系统评测 16 法:去卷积 Cell2location/SpatialDWLS/RCTD 最优;标签/表达迁移(单细胞↔空间互证)Tangram/gimVI/SpaGE 最优。→ 据此为 8 片定"主去卷积 + ≥1 正交法"的一致性纪律。
第二个正交去卷积;doublet/full 模式约束每 spot 类型数 + 平台差异校正;cell-type-aware DE(同类型内随空间环境变化)。→ 与 cell2location 交叉验证组成;并证明 M4↓ 是滋养层内在而非仅比例改变所致。
同组织(人胎盘/滋养层)同方法路线的整套范本:10x Visium + cell2location 把 VCT 亚型、EVT 侵袭轨迹在绒毛与滋养层壳中定位,做单细胞↔空间互证 + 龛位解读。→ 直接照搬"scRNA 定细胞态 → c2l 空间映射 → 龛位定位 → 双模态互证"骨架,是把空间部分写成 Nature 级图表结构的最佳模板。
空间龛位/邻域标准工具箱:neighborhood enrichment、co-occurrence、Moran's I 空间自相关、空间受限配受体。→ (a) SCT-VCT-EVT 龛位共定位;(b) 用 Moran's I 定量 M4 打分空间聚集是否在 PE 改变;(c) 机制层配受体解读。8 片批量适配。
同/连续切片上 MALDI-MSI 与 Visium 型 ST 的配准整合方法。→ 若拿到胎盘 MSI,把脂肪酸/酰基肉碱空间图与 M4 转录打分像素级共定位(详见第五节);暂无 MSI 也提供配准技术选型参考。
给"转录下调"补上独立于表达量的机制证据。Compass 命中主刊 Cell。
FBA 从 scRNA 推反应级代谢通量,恢复了 glycolysis↔FAO 开关并用 Seahorse 验证——与 M4 命题同构,是"提示→确证"标杆。→ 对 SCT/VCT/EVT 的 FAO/OXPHOS 反应打分,作独立于表达模块的机制层证据;先按供体聚合再 PE vs 对照(避免伪重复)。
FBA + 群落模型,明确支持 bulk 层通量估计——与 pseudobulk(n=4v4)天然契合,可直接在样本层做 FAO/OXPHOS 通量差异。→ 作 Compass/scFEA 之外第三种通量法,做多方法一致性。
图神经网络在通量平衡约束下估细胞级通量、识别"代谢模块";可用于空间。→ 用模块化通量 + 酶敏感性,定位驱动 M4↓ 的关键酶(CPT1/2、HADHA、ACADM)。
VISION/AUCell 对 KEGG/REACTOME 代谢通路单细胞打分,并在同研究里 scRNA↔10x 空间互证。→ 正是"单细胞↔Visium 双模态互证"范式:SCT 的 OXPHOS/FAO 打分 + Visium 同模块空间打分对比去卷积滋养层区。
奠定单细胞通路活性评分并系统揭坑:归一化(推荐 deconvolution)显著影响结论、dropout、需置换检验判显著;OXPHOS 是代谢异质性主源。→ 支撑 M4 打分的归一化选择与稳健性设计(年份早但必读)。
对应后续②(空间代谢组对接能量代谢物)。多为近 1 年论文,DOI 务必核对。
条件-VAE 把 ST 与 SM 嵌入共享潜空间,支持跨样本整合 + 批次校正——最贴合 n=4v4:8 片 Visium + 配套 MSI 共聚类、去批次、导出共享龛位。
具体配准流水线模板:Visium 与 MALDI/DESI-MSI(+H&E)配准,建 Visium spot↔MSI 像素 1:1 映射;开源(GitHub Core-Bioinformatics/magpie),含 MSI 后 RNA 完整性 QC。
配准后从差异代谢物/脂质、DE 基因及空间签名建代谢组–转录组关联网络,定义龛位内细胞特异代谢重塑。→ 检验空间共定位的 FAO/OXPHOS 转录与代谢物是否耦合。
用长链酰基肉碱(23 种 LCAC)作近端小管 FAO 的原位标志,并联配转录组 FAO/脂质基因(含病态细胞 FAO↓)。→ 直接借"某细胞类型内酰基肉碱 = FAO 标志"的读法,在 PE 合体滋养层确认 M4↓。
与你几乎同构:PE 胎盘 ST + SM + 公共 scRNA,'spot-match' 配准;报 SCT 比例↓、甘油磷脂/鞘脂重编程。→ 借 spot-match 去卷积-代谢物流程、SCT/VCT/EVT 分辨代谢物面板;并提醒模块比较须控构成。
微尺度 MALDI-MSI 分辨绒毛各区室(SCT/VCT/stroma)代谢/脂质差异。→ 提供预注册 MSI 靶标(该找哪些酰基肉碱/磷脂/能量代谢物、定位在哪),把"M4↓"变成无转录依赖的独立空间读数。
把上面各篇拼成一条可执行链路。方括号内为对应论文编号。
建议追加一轮 deep research 专攻空间半场,聚焦三个仍属"开放问题"的点: