MyoSpectrum
MyoSpectrum 是一个整合性的人类骨骼肌转录组图谱,涵盖健康和肌病状态。
WARNING
此项目V1.0已存档,不再更新。
概述
2024年4月10日,《Communications Biology》发表了华山医院神经肌肉病团队与赫尔辛基大学、坎帕尼亚大学、西澳大利亚大学、卡罗林斯卡医学院的合作研究。本研究通过整合分析揭示了 1,221 块人源骨骼肌的转录表达与临床表型之间的肌肉疾病谱联系。
背景
肌病指的是一大类影响人体骨骼肌系统的消耗性疾病,一般是遗传起病,多为罕见病。Bulk RNA-seq 作为一种基本的测序方法可以反映当前肌肉的瞬时转录生理状态,虽然在肌肉病的科学研究中得以运用,但当前已发表数据缺乏整合,转录与临床之间的关联性未得到系统性地研究。
本研究利用 GTEx 数据库、GEO 数据库以及赫尔辛基当地的人源骨骼肌 RNA-seq 数据(共 292 例肌病肌肉,929 例对照肌肉),分析了 1,221 块肌肉的转录组数据(9,231 基因)以及其与临床表型之间的共同关联。
研究设计
本研究纳入了不同肌病、不同测序方法、不同测序深度、不同表型的 Bulk RNA-seq 数据,数据集具有较大的异质性。
类似中国水墨画中的"白描"手法,本研究创新地通过不重要的留白(对照)来突出主线的重点(肌病)。因为肌病多为罕见病(发病率多十万分之一以下),GTEx 等普通人群来源数据(n = 803)可以视作健康对照。利用 GTEx 记录的捐赠者死亡原因,将肌肉按死亡原因归类,得到了三类对照:
- 非常健康对照 — 不伴有疾病事故性死亡(n = 234)
- 一般不健康对照 — 死亡时伴有一般疾病(n = 470)
- 严重不健康对照 — 死亡时伴有消耗性疾病(n = 87)
最终呈现出一种阶梯状进展的转录模式。

数据集
本研究包含 23 种肌肉表型(8 种对照,15 种肌病),mRNA 和全 RNA 两种测序方法。
| 表型 | 样本数 | 测序方法 | 来源 |
|---|---|---|---|
| 对照(意外死亡) | 31 | mRNA | GTEx |
| 对照(突然死亡) | 203 | mRNA | GTEx |
| 对照(中间死亡) | 46 | mRNA | GTEx |
| 对照(呼吸机病例) | 424 | mRNA | GTEx |
| 对照(缓慢死亡) | 87 | mRNA | GTEx |
| 对照(其他) | 111 | mRNA/total RNA | GTEx/GEO |
| 对照(截肢) | 24 | mRNA | Helsinki |
| 对照(高CK血症) | 3 | mRNA | Helsinki |
| FSHD | 61 | total RNA | GEO |
| DM1 | 44 | total RNA | GEO |
| LGMD R12 | 41 | total RNA | GEO |
| CDM | 36 | total RNA | GEO |
| Titinopathy | 31 | mRNA | Helsinki |
| IBM | 28 | mRNA/total RNA | Helsinki/GEO |
| DMD | 5 | total RNA | GEO |
| BMD | 5 | total RNA | GEO |
| Actinin-2 肌病 | 5 | mRNA | Helsinki |
| HNRNPA1 肌病 | 5 | mRNA | Helsinki |
| SMPX 肌病 | 4 | mRNA | Helsinki |
| 未确诊肌病 | 24 | mRNA | Helsinki |
总计:1,221 例肌肉(929 对照 + 292 肌病)
转录层面的肌肉疾病谱
在整合各类数据之后,可以看到进展所特有的转录层面规律:

谱系进展顺序:
- 非常健康的供体(因车祸、自杀等死因,n = 234)
- 一般疾病的供体(死亡时不健康,伴有各类疾病,n = 470)
- 消耗性疾病的供体(死亡时伴有消耗类疾病如癌症、肺结核等,n = 87)
- 肌肉病患供体(各类常见肌肉疾病,n = 292)
关键发现
值得关注的是最右肌病患者的肌肉并非完全不健康,仍有部分肌肉(高CK血症、无症状性肌病)向下突入了非常健康的范围,显示出与健康对照类似的转录模式——类似于临床实践中观察到的无症状临床前期阶段。
不论是年龄、性别、测序方法、还是肌病类型都不是肌肉疾病谱的导致因素。值得注意的是赫尔辛基肌病肌肉(mRNA 测序)与 GEO 的肌病肌肉(全 RNA 测序)都聚集在右上角,提示具有相同的转录模式。
临床验证
为了验证转录层面的渐进结果是否有临床意义,我们利用已发表的肌病数据进行多层面验证。

不论是数据层面的模拟,还是不同肌病临床特征的关联,均呈现出与肌肉疾病谱一样的阶梯样病情递增:
| 肌病 | 临床特征 | p 值 | 结果 |
|---|---|---|---|
| CDM | CTG 重复扩增(外周血) | 1.07e-03 | 显著阶梯进展 |
| LGMD R12 | Mercuri 评分(常规 MRI) | 2.09e-06 | 显著阶梯进展 |
| LGMD R12 | 10 米步行测试 | 0.014 | 显著阶梯进展 |
| LGMD R12 | 6 分钟步行测试 | 0.011 | 显著阶梯进展 |
| FSHD | 脂肪分数(定量 MRI) | 0.193 | 趋势一致 |
| FSHD | 病理评分 | 0.36 | 趋势一致 |
| FSHD | 临床严重程度评分 | 0.753 | 趋势一致 |
关于 FSHD
只有 CDM 与 LGMD R12 显示出了更明显的阶梯进展,原因可能与取样的肌肉异质性相关。CDM 和 LGMD R12 取自相同的肌肉(如股四头外侧肌),而 FSHD 来源多样(胫前肌、腓肠肌、股四头或股二头的一部分)。
特征基因与 qPCR 验证
利用 234 块非常健康的 GTEx 肌肉作为全新的健康对照,对整合数据进行 DEG 分析后,获得了各类肌病的转录标志。

关于对照的选取
因为伦理原因,不论是赫尔辛基的对照肌肉(高CK血症与糖尿病截肢患者来源)还是 GEO 数据库中的各类对照肌肉(病理层面正常的肌肉,疑似肌病患者来源)均处在中间并不健康的位置,而底下 234 块非常健康的肌肉(不伴有已知疾病的捐赠者)可以作为一种全新的健康对照。
一般肌病 Top 5 上调基因:
| 基因 | 全称 | 功能 |
|---|---|---|
| MGST1 | 微粒体谷胱甘肽 S-转移酶 1 | 抗氧化应激保护,在衰老中有潜在作用 |
| AOX1 | 醛氧化酶 1 | 参与肌发生 |
| FASN | 脂肪酸合酶 | 肌病肌肉中脂肪浸润的标志 |
| PRKCD | 蛋白激酶 C δ | 调节脂肪生成 |
| CHRNA1 | 胆碱能受体烟碱型 α1 | 在衰老骨骼肌中增加,诱导肌肉减少症 |
MGST1、AOX1、FASN、PRKCD、CYP4B1 五种基因在此前的肌病研究中从未被发现有意义,但在细胞动物实验模型中曾发现差异,提示当前肌病研究选用的对照并非完全"健康"。
Helsinki 肌肉 qPCR 验证:
- 一般肌病:MGST1(RQ 10.34/2.09,p = 0.02)、AOX1、FASN、PRKCD
- Titinopathy:CYP4B1(RQ 19.71/1.41,p = 0.03)
- IBM:CD163(RQ 27.87/10.05,p = 0.23)
通路分析提示肌病所影响的主要为代谢相关的通路。
组织反卷积
使用 TAPE 深度学习自编码器结合两个人类骨骼肌单细胞数据集(Tabula Sapiens 和 GSE143704)进行组织反卷积:
- 肌病组血管结构细胞比例较低,卫星干细胞、NK T 细胞和成纤维细胞(肌腱)较高
- 肌病组中脂肪细胞和 COL1A+ 成纤维细胞比例更大
同已发表结果的对比
采用同样的软件流程对整合数据和已发表结果的原始数据进行重分析对比后发现,肌肉测序结果存在**"金字塔"型**的呈现方式:
- 顶端的高差异基因几乎不受到样本量以及对照改变的影响
- 底部的差异基因则随之不断变化
特征基因在不同对照表型比较时持续保留(FSHD 80%、LGMD R12 80%、IBM 73.3%),当扩大样本量后保留率增至 100%。
结论
- 前所未有的对照:识别 234 例真正健康的 GTEx 肌肉作为全新对照
- 连续谱系:转录组景观揭示从健康到重度肌病的连续疾病进展
- 新型特征基因:MGST1、AOX1、FASN、PRKCD、CHRNA1 在既往肌病研究中鲜有报道
- 临床关联:转录谱系与 CTG 重复、MRI 脂肪浸润、步行试验等临床特征一致
局限性
- 整合过程本身会造成结果的干扰,特别是本数据集的巨大异质性
- 因伦理限制,实验验证部分缺乏"健康"肌肉作为对照,仅能用"病理健康"的肌肉代替
- 肌肉活检对肌肉的选择也会对结果造成差异
- 流式或大型单细胞数据集可以更好分析肌肉的构成
发表论文
Zhong, H., Sian, V., Johari, M., Katayama, S., Oghabian, A., Jonson, P. H., Hackman, P., Savarese, M., & Udd, B. Revealing myopathy spectrum: integrating transcriptional and clinical features of human skeletal muscles with varying health conditions. Communications Biology, 2024, 7(1):438. DOI
致谢
基金支持:FHRC、芬兰科学院、Jane and Aatos Erkko 基金、Magnus Ehrnrooth 基金、AFM Téléthon 基金、国家留学生基金委。
源代码
- GitHub: Hirriririir/MyoSpectrum