口腔医学小站

口腔文献阅读与资源分享

Cell | 小鼠不同组织的蛋白质相互作用图谱

| 暂无评论

Cell | 小鼠不同组织的蛋白质相互作用图谱

原创

何诗曼

 

2021年7月22日,不列颠哥伦比亚大学Michael Smith实验室等在Cell杂志上合作发表了题为An atlas of protein-protein interactions across mouse tissues的文章,文章中提出了一种新的定量蛋白质组学方法——将蛋白质相关性分析与哺乳动物的稳定同位素标记技术相结合(PCP-SILAM),绘制出七种小鼠组织的蛋白质相互作用组图谱,揭示了超过125000个独特的相互作用。

 

 

Highlights

 

1. PCP-SILAM方法实现了小鼠体内七种组织的蛋白质相互作用组图谱的生成

2. 生成的小鼠蛋白质相互作用组图谱超过原有规模两倍多

3. 不同组织的蛋白质相互作用重组受到严格监管

4. 与组织特异性疾病密切相关的蛋白质形成组织特异性子网络

 

 

 

 

Introduction

 

许多蛋白质的生物学功能依赖于与其他蛋白质的特定物理相互作用,这些相互作用的破坏可能导致疾病。因此,定义给定生物体中功能性蛋白质-蛋白质相互作用(相互作用组)的完整图谱是后基因组时代的长期目标,以期更好地理解蛋白质功能、细胞生理过程以及基因型和表型之间的关系。但是,现有的相互作用组图谱只对出现在特定细胞类型或组织中,或在病理生理相关条件下发生的相互作用提供了有限的见解。特异性的组织或细胞类型环境中的靶向相互作用组图谱揭示了特定人类疾病中蛋白质相互作用的重组,但关于哺乳动物组织间的蛋白质相互作用组的基本问题仍未解决。尽管已经进行了大规模的研究来分析人类组织的转录组、蛋白质组和表观基因组,但在相互作用组水平上的分析却是缺乏的。

在这里,作者将PCP与哺乳动物的稳定同位素标记技术(SILAM)相结合以生成七种小鼠组织的蛋白相互作用组图谱。这项研究不仅提供了哺乳动物组织特异性环境中蛋白质-蛋白质相互作用的全局视图,还提供了一个系统的超过原有规模两倍多的小鼠蛋白质相互作用组图谱,揭示了不同生理环境下蛋白质相互作用的广泛重组。

 

 

 

 

Results

 

一、小鼠组织的体内相互作用组定量分析

 

作者使用PCP-SILAM分析了七种小鼠组织的相互作用组,包括脑、心脏、骨骼肌(腓肠肌)、肺、肾、肝和胸腺(图1A)。从13C6-标记(重)和未标记(轻)小鼠组织中收集了总共55个SEC馏分。然后合并重馏分以生成全局参考混合物,并将其添加到所有770种轻馏分中。然后对每个馏分进行液相色谱-串联质谱(LC-MS/MS)分析。在所有馏分中总共检测到7,225种独特的蛋白质(图1B),包含了许多众所周知的蛋白质复合物,例如prefoldin复合物、COP9信号小体或eIF3复合物(图1C)。

 

 

 

图1 PCP-SILAM法测绘的七种小鼠组织的定量相互作用组图谱

 

作为对数据质量的初步评估,作者将PCP-SILAM与大规模蛋白质组学、转录组学和核糖体分析数据集进行了比较,以了解它们回收已知蛋白质复合物的能力。与大规模转录组、翻译组或蛋白质组数据集(图1G)相比,SEC馏分的共丰度模式被证明可提供更多信息,ROC曲线下的平均面积(AUC)为0.77,与现有的研究相比显著更高。值得注意的是,PCP-SILAM数据中的平均AUC高于对来自294种不同生物条件的5,288次SILAC蛋白质组学实验的meta分析。这些发现说明了PCP相对于大规模蛋白质组“协同调节”网络的主要优势:即通过SEC柱的分离特异性地将同一蛋白质复合物中的蛋白质对与间接关联的蛋白质对区分开来。在PCP-SILAM和基于细胞系的PCP-SILAC之间未观察到AUC的显着差异(图1H;p=0.58),表明尽管整个组织具有更大的复杂性,但对其进行体内相互作用组的分析并未影响数据质量。

 

二、小鼠组织相互作用组的高置信度统计推断

 

为了从PCP-SILAM组织蛋白质组谱中获得相互作用组,作者开发了PrInCE,这是一种用于分析共分馏质谱数据的机器学习管道(图2A)。与以前从共分馏数据和公开可用的基因组数据集共同学习的方法相比,PrInCE回收PPIs(蛋白质-蛋白质相互作用)完全来源于质谱数据中所获得的特征。将PrInCE应用于PCP-SILAM数据,在每个组织中识别出19,804到35,536次相互作用(FDR=5%),总共有125,696次独特的相互作用(图2B)。

 

 

 

图2 小鼠组织相互作用组的推断和验证

 

为了评估从PCP-SILAM数据推断出的网络的质量,作者将每个小鼠组织相互作用组与五个最近发表的使用AP-MS/Y2H进行的高通量人类相互作用组筛选,以及其他文献报道(literature-curated,LC)的相互作用进行了比较。作者计算了反映每个网络与其他大规模基因组数据集一致性的三个指数。所有三个指数都产生了大致一致的网络质量(图2C-E)。这些发现表明PCP-SILAM网络的质量可与最近系统的人类筛查和由假设驱动的小规模实验所确定的相互作用相媲美。

 

为了通过实验验证PCP-SILAM在小鼠组织中绘制相互作用图谱的能力,作者首先关注了细胞骨架蛋白talin与包含伴侣蛋白的TCP1复合物亚基之间假定存在的相互作用,这之前在小鼠或人类中均未报道过(图2F)。talin的免疫沉淀证实了在小鼠大脑中与TCP1的相互作用(图2G)。为了确认相互作用的组织特异性,作者还在小鼠肝脏中进行了免疫沉淀,其中talin和TCP1复合曲线显示出有限的相关性,并观察到有限的共纯化,与PCP-SILAM结果相一致(图2F和2G)。类似地,作者检测了一个明显的心脏特异性核糖体中的旁系同源物开关,该开关由组成型的Rpl3被其旁系同源物Rpl3l替换而驱动(图2H)。Rpl3l主要在心脏和骨骼肌中表达,它的突变与心房颤动有关。作者从小鼠不同组织中分离纯化出核糖体,然后进行无标记定量,证实了Rpl3l被纳入心脏特异性核糖体(图2I)。因此,正交生化技术证实了PCP-SILAM揭示不同组织相互作用组动态重排的能力。

 

三、PCP-SILAM对小鼠相互作用组的无偏性扩展

 

小鼠是一种常见的模式生物,但人们从未测绘过它的相互作用组图谱。为了将作者的网络与已知的小鼠相互作用组进行比较,作者收集了来自9个相互作用数据库的小规模实验中检测到的82,602个小鼠PPI。令人惊讶的是,在PCP-SILAM检测到的125,696个独特相互作用中,只有4,354(2.1%)个与小规模实验检测到的相互作用重叠(图3A)。作者推断,这种相对较小的重叠可能由两个因素来解释:(1)已知小鼠相互作用组的规模小,以及(2)PCP-SILAM与小规模研究中使用的测定之间存在互补性。

 

 

 

图3 PCP-SILAM对LC的小鼠相互作用组的无偏性扩展

 

本研究中检测到的其余121,342种独特的相互作用以前没有在小鼠中报道过;因此,作者的蛋白质组规模资源将小鼠相互作用组扩展了约2.5倍(图3B)。为了在功能上表征这些PPI,作者比较了LC和PCP-SILAM相互作用之间的GO术语共同注释模式(图3C)。相对于LC的相互作用,PCP-SILAM检测到的小鼠PPI在代谢、翻译和蛋白质折叠的连接方面富集,缺乏细胞间信号传导和增殖的连接。这些发现与PCP-SILAM优先考虑胞质而非核或细胞外复合物的预期基本一致。

作者接下来研究了PCP-SILAM检测到的PPI是否优先扩展了小鼠整体相互作用组的现有区域,或者倾向于形成不同的子网络。为了提供网络拓扑的全局视图,作者应用马尔可夫聚类将整个小鼠相互作用组(包括LC和PCP-SILAM)分组为696个集群(图3D)。92个集群包含至少一种由PCP-SILAM检测到的PPI,其中有50个(54%)还同时包含LC和高通量的PPIs,42个仅由PCP-SILAM相互作用组成。因此,虽然PCP-SILAM揭示了几个在小鼠中完全未知的蛋白质群落,但许多相互作用也扩展了先前由小规模实验定义的小鼠相互作用组的邻域。

LC的蛋白质相互作用数据集受到质疑,因为它们偏向于一组相对较小的高度研究的蛋白质集。高通量互作组图谱研究提供了一种不受研究者偏见影响而定义蛋白质组结构的方法,而且与文献收集的数据集相比,PCP-SILAM检测到的PPIs分布更为均匀(图3G)。

随后,作者假设在生理环境中绘制体内相互作用组,例如在个体组织中,可以优先揭示新的相互作用。最终发现,PCP-SILAM确定了218种未知功能蛋白质的相互作用伙伴,并且这些相互作用比相互作用组平均水平具有显着更高的组织特异性(图3E)。类似地,作者绘制了涉及366种蛋白质的相互作用,这些蛋白质之前没有检测到相互作用的伙伴(interactome orphans)并发现这些相互作用同样显示出组织特异性显著增强的趋势(图3F)。因此,绘制哺乳动物组织的体内相互作用组可以揭示蛋白质组研究不充分的部分信息。

 

四、广泛的相互作用组重组限制了组织特异性相互作用组预测的准确性

 

在缺乏实验性的组织或细胞类型特异性相互作用组的情况下,计算方法已经发展到预测背景特异性的分子相互作用网络。背景特异性相互作用组预测最广泛使用的策略是:如果两个基因都表达,则两个基因的蛋白质产物只能在给定的背景下相互作用。基因或蛋白质表达数据叠加到静态交互组上,提取节点表达高于特定阈值的网络子集以生成背景特异性的交互组(图4A)。另一种策略是构建组织特异性基因共表达网络,这意味着如果不是物理相互作用,则代表着给定组织中的功能关联。然而,这些方法做出的预测在多大程度上捕获了生理相关的相互作用组重组尚不清楚。

 

 

 

图4 相互作用组的重组限制了组织特异性交互组预测的准确性

 

使用PCP-SILAM小鼠组织相互作用组作为参考,作者研究了这些方法在预测组织特异性相互作用组方面的准确性。作者计算了预测的和PCP-SILAM组织相互作用组之间的重叠,然后将这种重叠与观察到的随机重组的网络进行比较。令人惊讶的是,相对于随机网络(图4B),基于基因表达预测的组织相互作用组对于实验检测到的相互作用仅富集了2到4倍。这种重叠非常显着,但幅度很小。将蛋白质或磷酸化蛋白丰度叠加到静态网络上,而不是基因表达上,并没有显着改善重叠。因此,无论是组织特异性基因或蛋白质表达,还是共表达,都不足以准确预测组织特异性物理PPI。

预测的组织相互作用组的拓扑结构也与实验确定的相互作用组显着不同。在交互组网络中,连接度最高(“枢纽”)的蛋白质进化缓慢且在生理上是不可或缺的。预测的组织相互作用组的中枢蛋白在组织间高度一致,每个组织中65%–70%的中枢蛋白在所有预测网络之间共享(图4C)。然而,作者发现中枢蛋白在体内的一致性要差得多,在所有组织中只有20个中枢蛋白共享(图4C)。更普遍地说,在体内相互作用中,任何特定蛋白质参与的相互作用的数量(其程度)在组织之间的变化要比在预测的网络中大得多(图4D)。类似地,与仅通过基因表达预测的相比,蛋白质显示出与组织中不同伙伴相互作用的趋势要大得多(图4E)。

综上所述,这些分析揭示了小鼠不同组织的相互作用网络的广泛重组,超出了仅从基因表达可见的范围,影响了单个蛋白质的特定相互作用物和生理相互作用组的全局拓扑特性。至关重要的是,一对蛋白质可以在至少一个环境中相互作用的观察结果并不意味着它们在第二个环境中的表达是重现相互作用的充分条件。例如,尽管F-肌动蛋白加帽蛋白(CapZ)和CapZ相互作用蛋白(CapZIP或Rcsd1)在所有七种组织中都表现出强烈的表达,但这种相互作用是特定于心脏和肌肉的(图4G)。仅根据蛋白质表达无法预测这种组织特异性模式。为了更系统地评估预测的相互作用组是否因组织特异性相互作用而缺失,作者分别为每个组织的相互作用网络进行了随机分组,并计算了在1到7个随机组织相互作用组中发现的相互作用总数。与仅基因表达会低估组织间相互作用组变异程度的预期一致,相对于PCP-SILAM相互作用组,预测的相互作用组在大多数组织特异性相互作用中显著缺失(图4F)。

 

五、哺乳动物组织中相互作用的进化

 

将一种生物体中检测到的物理相互作用外推到不同生物体中的直系同源蛋白质对,已被广泛用于预测非模式生物的相互作用组,或者是增加人类相互作用组的覆盖范围。检查三个模型生物的LC相互作用和五个最近的人类高通量相互作用组筛选,作者发现组织特异性相互作用不太可能在进化上保守(图5A)。产生组织特异性相互作用的蛋白质对同样以不太相似的速率共同进化(图5B)。并且相对于普遍相互作用,真核基因组中存在和缺失的相关模式较少(图5C)。因此,实验筛选和大规模基因组数据都突出了组织特异性相互作用的进化新颖性。

 

 

 

图5 哺乳动物组织相互作用组的进化

 

在每个组织中,管家蛋白与其他管家蛋白的相互作用显示出非常显着的富集(图5D)。相比之下,作者观察到与随机网络相比,组织特异性蛋白和管家蛋白之间相互作用的系统性损耗,特别是在所有七个组织中汇总结果时(图5E)。因此,实验性组织相互作用组图谱表明,进化上新颖的组织特异性相互作用在很大程度上独立于通用相互作用的核心模块来完成组织特异性功能。

总之,这些分析对比了两个系统:存在于所有小鼠组织中的核心细胞模块,以及在单个组织内执行特定功能的辅助模块。前者涉及在很长的进化时间范围内共同进化的古老蛋白质,其相互作用伙伴在物种和组织中得以保存。相比之下,组织特异性相互作用在其他物种中不太保守,并且不成比例地涉及较年轻的蛋白质。值得注意的是,作者观察到这两个系统之间的串扰受到抑制,组织特异性和通用蛋白质之间的相互作用显着减少。

 

六、组织特异性相互作用重组的严格调控

 

已经确定进化上古老的蛋白质在组织中具有比相互作用组平均值明显更稳定的相互作用伙伴,本研究试图进一步描述蛋白质的特性,这些蛋白质的相互作用以组织特异性的方式不成比例地重组。为了量化每种蛋白质组织间重组的相互作用程度,作者使用Jaccard指数比较了所有组织对中其相互作用伙伴的相似性(图6A)。

 

 

 

图6 对相互作用重组的严格监管

 

正如预期的那样,已知蛋白质复合物的成员具有较高的Jaccard指数,在组织中的重新连接显着减少(图6B)。然而,GO富集分析未能识别重新连接的蛋白质中过度表达的功能类别。因此,作者又研究了蛋白质结构特征是否可以预测重组。事实发现,无序蛋白质比它们的结构对应物具有明显更多的重新连接(图6C)。无序的蛋白质片段通常嵌入可以被球状结构域结合的短肽相互作用基序,并且包含此类线性基序的蛋白质同样被显着更多地重新连接(图6D)。内在无序区域也被认为是蛋白质磷酸化的热点,这增加了通过组织特异性翻译后修饰协调相互作用重组的可能性。与这种可能性相一致,磷酸化蛋白在重新连接的蛋白质中富集(图6E),并且重新连接的蛋白质上的磷酸化位点比通用蛋白质上的磷酸化位点明显更具组织特异性。这些发现表明嵌入固有无序区域的结合基序和翻译后修饰位点促进了哺乳动物组织中蛋白质相互作用伙伴的重新连接。

无序蛋白质经常参与信号通路或介导调节功能。作者发现组织间重新连接PPI更可能涉及蛋白激酶、转录因子和细胞表面蛋白受体,可以促进组织特异性信号传导过程。通过计算中介中心性,作者发现组织特异性相互作用具有比通用相互作用显着更高的中心性(图6F)。因此,分子和网络拓扑观点都强调了组织特异性相互作用在组织特异性途径内传播生物信息中的关键作用。

在细胞内,精确地传递生物信息需要大分子相互作用的精确协调。因此,作者假设相互作用伙伴在生理环境中高度可变的蛋白质将受到严格的调节机制的影响,并探寻特定的细胞策略是否调节重新连接蛋白质的可用性。编码重新连接的蛋白质的mRNA的表达水平较低,半衰期较短,转录速度较慢,而且重新连接的蛋白质本身也较少(图6G),并且这种丰度差异受到翻译速率降低和降解速率增加的控制(图6H和6I),表明多种细胞机制汇聚以严格调节蛋白质丰度,其相互作用的伙伴在组织中重新连接。

鉴于重新连接的蛋白质受到严格调控,作者进一步研究了相互作用伙伴在组织之间高度重新连接的蛋白质是否与有害表型相关。值得注意的是,作者发现疾病基因在组织中的重新连接明显多于相互作用组平均值(图6J)。因此,作者利用了与组织特异性病理相关的疾病基因资源研究这些基因的蛋白质产物是否在疾病相关组织的相互作用组中优先相互连接,事实上,疾病相关组织中疾病基因之间的平均最短路径明显更小(图6K),表明形成了组织特异性疾病模块。Cryab是一种具有内在紊乱的C末端片段的热激活蛋白,与许多神经系统疾病有关。Iqgap2是一种轴突生长所需的多功能信号蛋白。Cryab和Iqgap2之间的相互作用提供了组织间疾病基因重连的例子。PCP-SILAM在大脑中检测到此种相互作用,但未在肾脏或肌肉中检测到此种相互作用,尽管相互作用的蛋白质在所有三种组织中都有很强的表达(图6L)。

总之,这些分析突出了无序区域内的蛋白质结合基序和翻译后修饰位点在介导不同生理环境的相互作用重组中的作用。由此产生的组织特异性相互作用与组织特异性信号通路中生物信息的传递有关。高度重新连接的蛋白质受到多种细胞聚合机制的严格调控,这可能是为了确保生物信息流的保真度。但是疾病基因之间相互作用重组的速度提高,这意味着疾病病理生理学中这种调控级联的功能发生障碍。值得注意的是,疾病基因在具有疾病表现的组织的相互作用组中优先相互连接,这表明绘制背景特异性相互作用组对于阐明疾病模块和病理生物学的基础至关重要。

 

 

 

 

Discussion

 

总而言之,本研究中提出的定量蛋白质组学方法PCP-SILAM的优势在于它是一种无针对性且相对无偏见的技术。并且,作为一种用于体内相互作用组图谱的高通量技术,PCP-SILAM特别适合发现多种生理条件下的相互作用,以研究体内多个不同组织相互作用组的重组。由此产生的相互作用组包含先前未映射的区域和小鼠相互作用组内的功能类别,并将研究不足的小鼠蛋白质置于组织特定的功能环境中,这表明PCP-SILAM将是一种有价值的方法,可以阐明蛋白质组中知之甚少的成分。

 

 

 

 

Limitations of the study

 

首先,作者发现与仅基于光通道的量化相比,基于SILAM比率的蛋白质量化的技术精度较高。然而,这种比较受到以下事实的限制:

1)在没有任何同位素标记的实验中,蛋白质定量的动态范围预计会更高,这无法与无标记实验进行直接地比较。

2)虽然此处确定的125,00种独特相互作用中的绝大多数以前没有在小鼠中报道过,但其中一些以前已经在人类中发现过。

3)一个更广泛的限制是这里分析的七种组织每个都由多种不同的细胞类型组成,这些细胞类型也有自己的细胞类型特异性相互作用组。未来开展以提高体内相互作用组映射到细胞亚群水平的分辨率的工作是必要的。

 

 

 

 

 

 

点击数:0

发表回复

*为必填字段!