Deep Research · 顶刊生信方法调研

PE 胎盘 M4(FAO/OXPHOS)项目
可迁移的顶刊生物信息学分析方法

系统调研近 5 年(2021–2026)Cell / Nature / Science 三大主刊及其核心子刊,面向"把滋养层线粒体能量代谢下调从提示性推向确证"的分析目标,逐篇给出可借鉴的方法、工具与统计策略。

项目背景 · 8 例配对胎盘(4 PE vs 4 对照,全女胎)· 单细胞 65,828 细胞 / 12 类(含 SCT/VCT/EVT)+ 10x Visium 8 片 · 核心统计纪律:样本层 pseudobulk(n=4v4),坚决避免逐细胞伪重复。
5
检索角度
26
来源论文
123
抽取论断
25
对抗验证
21
核验确认

图例 期刊范围 & 验证层

✅ 主刊/核心子刊 在指定范围内(Cell/Nature/Science + Nature Methods·Biotech·Genetics·Communications、Cell Systems/Reports/Reports Methods)   ◇ 领域外必读 期刊在范围外但方法学必读

【已验证】 经 3 票对抗式核验通过   【已检索】 命中且高相关、DOI 可靠,但本轮未走对抗验证(引用前请二次核对)

一句话结论

  • 统计地基被文献一边倒钉死:n=4v4 单细胞病例-对照只能在供体层做 pseudobulk(按 样本×细胞类型 加和 counts → DESeq2/edgeR/limma-voom),绝不能逐细胞检验——伪重复把假阳性抬到离谱(默认 MAST 一类错误达 0.862;某 AD 数据逐细胞 14,274 DEG,pseudobulk 后仅 26 个,差 549 倍)。你项目现有纪律完全站得住。
  • 功效来自"人数"不是"细胞数" → n=4v4 处在够用线下沿,必须配留一供体 + 效应量 + 正交确证;单模态显著先按"提示性"写。
  • M4 模块检验:pseudobulk 上用 CAMERA(竞争性)+ fry/roast(自洽)双报;逐细胞/空间可视化用 AUCell/UCell(不要用 ssGSEA/GSVA);decoupleR/irGSEA 当一致性佐证而非"更准"。
  • 空间半场检索到一批高质量顶刊范本,但未走对抗验证,DOI 引用前请二次核对(尤其 2025/26 的几篇)。

单细胞 · 小样本病例-对照 【已验证 · 高置信】

本项目的统计地基。以下 6 篇确立"反伪重复 + pseudobulk"共识,4 篇在你指定期刊范围内。

2.1 反伪重复 + pseudobulk

1

Squair et al. — Confronting false discoveries in single-cell differential expression

Nat Commun 202110.1038/s41467-021-25960-2

逐细胞 DE "无扰动也能报几百个假 DEG";六个最优方法都先聚合成 pseudobulk;RNAscope 验证 edgeR 5/6 命中 vs Wilcoxon 仅 3/13 这就是 M4"提示性→确证"的正交验证范式(表达信号 + 原位/RNAscope 复核)。

2

Crowell et al. (muscat) — muscat detects subpopulation-specific state transitions

Nat Commun 202010.1038/s41467-020-19894-4

正式提出 differential state 要在样本层推断、让结论外推到样本而非细胞;聚合法(limma-voom/-trend、edgeR)又快又稳,碾压 MAST/scDD。 M4 逐细胞类型 pseudobulk 的标准框架与代码路线。

3

Zimmerman, Espeland & Langefeld — 单细胞病例-对照中的伪重复

Nat Commun 202110.1038/s41467-021-21038-1

量化伪重复:默认 MAST 一类错误达 0.862,加细胞越加越糟;增加个体数才是提功效的正道 论证 n=4v4 的边界,并解释为何靠加队列(后续④)而非加细胞。

4

Murphy & Skene — 推荐在单细胞 DE 中使用 pseudobulk

Nat Commun 202210.1038/s41467-022-35519-4

平衡评价下 pseudobulk 综合最优,明确"推荐在 scRNA DE 中用 pseudobulk"。 作方法学引用背书本项目路线。⚠️ 只引"推荐 pseudobulk"这一结论,别引其 MCC "平衡度量"的具体表述(核验中被否 0-3)。

5

Murphy, Fancy & Skene — 阿尔茨海默 snRNA 重分析

eLife 2023eLife:90214

把首个 AD snRNA(Mathys 2019)重算:FDR<0.05 下 14,274 → 26 个 DEG(少 549 倍) 给审稿人最直观的"为什么不能逐细胞"实证。

6

Lee & Han — pseudobulk 与 GLMM 的统计等价性(理论证明)

Bioinformatics 202410.1093/bioinformatics/btae498

数学证明:带正确 offset(每供体细胞级 size factor 之和)的 pseudobulk 与负二项 GLMM 统计性质几乎相同(logFC、方差、p 值校准一致)——前提正是"细胞分组在供体层完全确定"的病例-对照设计。 免去跑昂贵 GLMM 堵审稿人;pseudobulk 不是"省事近似"而是等价方案。⚠️ 此前误标作者为 Murphy & Skene,已更正。

2.2 小 n 的稳健性纪律(可直接抄成方法段)

留一供体(LODO):逐一去掉每个 PE/对照样本重算,证 M4↓ 不被单一样本驱动  ·  效应量优先于 p:报 logFC + CI / Cliff's δ  ·  构成混杂控制:逐类型内比较 + 显式检验各类型两组比例差(应无 FDR 显著)  ·  ⚠️ pseudobulk 偏保守:n=4 阴性是"本样本量未检出",不是"无效应"

2.3 模块 / 基因集水平检验(M4 怎么测) 已验证

7

Wu & Smyth — CAMERA:校正基因间相关的竞争性基因集检验

Nucleic Acids Res 201210.1093/nar/gks461

竞争性检验必须校正基因间相关(否则一类错误 7–8×);CAMERA 用单一 VIF 校正,极少生物学重复下仍控住一类错误;并厘清自洽 vs 竞争性之别。 M4 在 pseudobulk 上用 CAMERA + fry/roast 双报。⚠️ n=4 下 CAMERA 偏保守,M4 竞争性不显著 ≠ 无效应。

8

Badia-i-Mompel et al. — decoupleR:多方法活性推断集成

Bioinformatics Advances 202210.1093/bioinformatics/vbac016

一个接口打包 11 种活性推断(AUCell/GSEA/GSVA/ULM/VIPER…),给跨方法 consensus 均值 z;R + Python 双端。 M4↓ 需在 ≥2 种打分器下方向一致才升级。⚠️ "多方法=更准"被否(0-3),只当一致性/收敛效度用。

9

Fan et al. — irGSEA:秩基单细胞基因集富集的集成

Briefings in Bioinformatics 202410.1093/bib/bbae243

整合 6 种秩基单细胞打分(AUCell/UCell/singscore/ssGSEA/JASMINE/VIPER),用 Robust Rank Aggregation 聚合出跨方法稳健富集集。 单细胞层 M4 的多打分器一致性检验。

10

Noureen et al. — bulk 打分法不适用于单细胞

eLife 2022eLife:71994

ssGSEA/GSVA 在稀疏 scRNA 上有偏,单细胞原生法(AUCell/UCell/JASMINE)更稳 65,828 细胞与 8 片 Visium 的 M4 逐点打分一律用 AUCell/UCell;ssGSEA/GSVA/CAMERA 只留给非稀疏的 pseudobulk 矩阵。⚠️ "bulk 法专门压低下调方向(25/23 vs 6/5)"被否(0-3),别用该论据;该文作者与 JASMINE 有利益关系,优先用独立验证的 AUCell/UCell。

空间转录组 【已检索 · 未对抗验证】

与单细胞并列的优先环节。以下多在你指定期刊范围内,DOI 引用前建议二次核对。

11

Kleshchevnikov et al. — cell2location:空间转录组细胞类型精细制图

Nat Biotechnol 202210.1038/s41587-021-01139-4

贝叶斯层级去卷积,用 scRNA 参考(即你 65,828/12 类)估每 spot 的 SCT/VCT/EVT 丰度,显式建模批次/检测灵敏度(8 片间校正)。 得丰度后做丰度加权的 spot 级 M4 打分,看 M4 是否在 PE 的 SCT/VCT 富集区空间下调;丰度矩阵反过来控构成混杂。(你项目已在用)

12

Li et al. — 空间与单细胞整合方法系统基准

Nat Methods 202210.1038/s41592-022-01480-9

45 真实 + 32 模拟系统评测 16 法:去卷积 Cell2location/SpatialDWLS/RCTD 最优;标签/表达迁移(单细胞↔空间互证)Tangram/gimVI/SpaGE 最优。 据此为 8 片定"主去卷积 + ≥1 正交法"的一致性纪律。

13

Cable et al. — RCTD(spacexr):空间细胞类型混合的稳健分解

Nat Biotechnol 202210.1038/s41587-021-00830-w

第二个正交去卷积;doublet/full 模式约束每 spot 类型数 + 平台差异校正;cell-type-aware DE(同类型内随空间环境变化)。 与 cell2location 交叉验证组成;并证明 M4↓ 是滋养层内在而非仅比例改变所致。

14

Arutyunyan et al. — 早孕滋养层发育空间多组学图谱(Vento-Tormo 组)

同组织(人胎盘/滋养层)同方法路线的整套范本:10x Visium + cell2location 把 VCT 亚型、EVT 侵袭轨迹在绒毛与滋养层壳中定位,做单细胞↔空间互证 + 龛位解读。 直接照搬"scRNA 定细胞态 → c2l 空间映射 → 龛位定位 → 双模态互证"骨架,是把空间部分写成 Nature 级图表结构的最佳模板。

15

Palla et al. — Squidpy:可扩展的空间组学分析框架

Nat Methods 202210.1038/s41592-021-01358-2

空间龛位/邻域标准工具箱:neighborhood enrichment、co-occurrence、Moran's I 空间自相关、空间受限配受体。 (a) SCT-VCT-EVT 龛位共定位;(b) 用 Moran's I 定量 M4 打分空间聚集是否在 PE 改变;(c) 机制层配受体解读。8 片批量适配。

16

Vicari et al. — SMA:同片转录组 + 代谢组空间多模态分析

Nat Biotechnol 202410.1038/s41587-023-01937-y

同/连续切片上 MALDI-MSI 与 Visium 型 ST 的配准整合方法。 若拿到胎盘 MSI,把脂肪酸/酰基肉碱空间图与 M4 转录打分像素级共定位(详见第五节);暂无 MSI 也提供配准技术选型参考。

代谢通路 / 流量推断 —— M4 的机制层正交证据 【已检索】

给"转录下调"补上独立于表达量的机制证据。Compass 命中主刊 Cell。

17

Wagner / Yosef et al. — Compass:单细胞代谢通量建模

FBA 从 scRNA 推反应级代谢通量,恢复了 glycolysis↔FAO 开关并用 Seahorse 验证——与 M4 命题同构,是"提示→确证"标杆。 对 SCT/VCT/EVT 的 FAO/OXPHOS 反应打分,作独立于表达模块的机制层证据;先按供体聚合再 PE vs 对照(避免伪重复)。

18

METAFlux — 从 bulk / 单细胞 RNA-seq 刻画代谢通量

Nat Commun 202310.1038/s41467-023-40457-w

FBA + 群落模型,明确支持 bulk 层通量估计——与 pseudobulk(n=4v4)天然契合,可直接在样本层做 FAO/OXPHOS 通量差异。 作 Compass/scFEA 之外第三种通量法,做多方法一致性。

19

Alghamdi et al. — scFEA:图神经网络估计单细胞代谢通量

Genome Research 2021PMC8494226

图神经网络在通量平衡约束下估细胞级通量、识别"代谢模块";可用于空间。 用模块化通量 + 酶敏感性,定位驱动 M4↓ 的关键酶(CPT1/2、HADHA、ACADM)。

20

scMetabolism(CRC 肝转移:单细胞 + 空间互证)

Cancer Discovery 2022PMID 34417225

VISION/AUCell 对 KEGG/REACTOME 代谢通路单细胞打分,并在同研究里 scRNA↔10x 空间互证。 正是"单细胞↔Visium 双模态互证"范式:SCT 的 OXPHOS/FAO 打分 + Visium 同模块空间打分对比去卷积滋养层区。

21

Xiao, Dai & Locasale — 单细胞分辨率的肿瘤微环境代谢景观(方法基线)

Nat Commun 2019 (超 5 年窗)10.1038/s41467-019-11738-0

奠定单细胞通路活性评分并系统揭坑:归一化(推荐 deconvolution)显著影响结论、dropout、需置换检验判显著;OXPHOS 是代谢异质性主源。 支撑 M4 打分的归一化选择与稳健性设计(年份早但必读)。

空间转录组 × 空间代谢组(MSI)整合 【已检索】

对应后续②(空间代谢组对接能量代谢物)。多为近 1 年论文,DOI 务必核对。

22

SpatialMETA — 空间转录组与代谢组的跨样本跨模态整合(浙大 Wanlu Liu 组)

Nat Commun 202510.1038/s41467-025-63915-z

条件-VAE 把 ST 与 SM 嵌入共享潜空间,支持跨样本整合 + 批次校正——最贴合 n=4v4:8 片 Visium + 配套 MSI 共聚类、去批次、导出共享龛位。

23

MAGPIE — 空间转录组 × 代谢组配准整合框架(Core-Bioinformatics)

Nat Commun 2025/2610.1038/s41467-025-68003-w

具体配准流水线模板:Visium 与 MALDI/DESI-MSI(+H&E)配准,建 Visium spot↔MSI 像素 1:1 映射;开源(GitHub Core-Bioinformatics/magpie),含 MSI 后 RNA 完整性 QC。

24

Sun, He et al. — 胃癌空间多组学(代谢-转录关联网络)

Nat Commun 202310.1038/s41467-023-38360-5

配准后从差异代谢物/脂质、DE 基因及空间签名建代谢组–转录组关联网络,定义龛位内细胞特异代谢重塑。 检验空间共定位的 FAO/OXPHOS 转录与代谢物是否耦合。

25

人肾区域解剖重定义 —— 空间代谢组直读 FAO 的最佳范例

Cell Metabolism 202410.1016/j.cmet.2024.02.015

长链酰基肉碱(23 种 LCAC)作近端小管 FAO 的原位标志,并联配转录组 FAO/脂质基因(含病态细胞 FAO↓)。 直接借"某细胞类型内酰基肉碱 = FAO 标志"的读法,在 PE 合体滋养层确认 M4↓。

26

晚发型 PE 胎盘 空间转录组 + 空间代谢组(最接近的疾病先例)

Front Cell Dev Biol 202510.3389/fcell.2025.1659880

与你几乎同构:PE 胎盘 ST + SM + 公共 scRNA,'spot-match' 配准;报 SCT 比例↓、甘油磷脂/鞘脂重编程。 借 spot-match 去卷积-代谢物流程、SCT/VCT/EVT 分辨代谢物面板;并提醒模块比较须控构成。

27

胎盘绒毛 微尺度 MSI 图谱(同组织参考特征表)

Nat Commun 202510.1038/s41467-025-57107-y

微尺度 MALDI-MSI 分辨绒毛各区室(SCT/VCT/stroma)代谢/脂质差异。 提供预注册 MSI 靶标(该找哪些酰基肉碱/磷脂/能量代谢物、定位在哪),把"M4↓"变成无转录依赖的独立空间读数。

给 M4 项目的推荐分析流水线

把上面各篇拼成一条可执行链路。方括号内为对应论文编号。

  1. DE 层(单细胞):每类细胞 样本×类型 加和 counts → DESeq2/edgeR/limma-voom pseudobulk,~group,PE vs 对照(仅纳入每组 ≥3 样本、每样本 ≥10 细胞的类型)。[#1–4,6]
  2. M4 模块层:pseudobulk 上 CAMERA + fry/roast 双报;逐细胞/空间可视化用 AUCell/UCell;decoupleR/irGSEA 做多打分器一致性(佐证,非"更准")。[#7–10]
  3. 稳健性:LODO + 效应量 + 构成差异检验;阴性只写"未检出"。[2.2]
  4. 空间层:cell2location(主)+ RCTD(正交)去卷积 → 丰度加权 spot 级 M4 打分 → Squidpy 做 Moran's I 空间聚集 + SCT/VCT/EVT 龛位;按 Arutyunyan Nature 2023 骨架组图。[#11–15]
  5. 机制层(正交①):Compass/METAFlux(+scFEA)供体聚合后估 FAO/OXPHOS 通量,三法一致 → 独立于表达的机制证据;定位关键酶(CPT1/2、HADHA、ACADM)。[#17–19,21]
  6. 代谢物层(正交②):若有 MSI,MAGPIE/SpatialMETA/SMA 配准 → 参照肾 LCAC 与绒毛 MSI 图谱预注册酰基肉碱/磷脂靶标 → 与 M4 打分空间共定位/关联网络。[#22–27]
  7. 确证层:独立公共 PE 队列复算 M4 + metaRNASeq 合并(后续④);功能学 Seahorse(后续⑤,呼应 Compass 逻辑)。

必须避开的坑(对抗核验否决项 + 更正)

  1. "多方法组合 = 更准"(irGSEA 相关论断 0-3 被否)→ 集成只作一致性检查。
  2. "ssGSEA/GSVA 专门压低下调方向(25/23% up vs 6/5% down)"(0-3 被否)→ 换用"稀疏数据更稳"的理由即可。
  3. 引用 Murphy & Skene 的 MCC "平衡度量"具体表述(0-3 被否)→ 但"推荐 pseudobulk"结论本身成立。
  4. 把 pseudobulk 说成"绝对优于混合模型"(强表述 1-2 被否)→ 正确说法:病例-对照下二者等价(Lee & Han 2024)。
  5. ✅ 更正 pseudobulk ≈ GLMM 等价性论文是 Lee & Han 2024(Bioinformatics btae498),非 Murphy & Skene。
  6. ⚠️ pseudobulk 偏保守 → n=4 阴性是功效不足,不是"无效应"。

诚实的缺口与下一步

验证不对称:第二节 Track 1(单细胞 + 基因集,21 条论断)经 3 票对抗核验;第三/五节空间与 MSI 部分只走到"检索 + 抽取",未对抗验证(验证预算被单细胞半场占满)。这些论文相关度高、DOI 基本可靠,但引用前建议二次核对(尤其 2025/26 的 #22 / #23 / #27)。

建议追加一轮 deep research 专攻空间半场,聚焦三个仍属"开放问题"的点:

  • ① Visium 小样本去卷积如何避免"spot 级伪重复" + 8 片间批次校正的最佳实践;
  • ② 单细胞 ↔ 空间互证的定量指标(而非仅肉眼对图);
  • ③ scFEA/Compass 通量在 n=4v4 下如何聚合到供体层,以及 pseudobulk 框架内正式控制细胞构成差异的方法。