一、背景介绍
尽管已开发出高通量的表型分析方法来筛选潜在的药物组合,但从众多药剂产生的巨大组合空间中彻底搜索顶级命中仍然是一项艰巨的任务。利用药理学数据的快速积累的计算方法可以提供一种经济有效的选择,以实现对药物组合的更系统的分析。特别是“组学”技术的出现使我们能够测量生物途径和分子相互作用中的药物扰动,从而产生了一种新兴的系统级方法,称为网络药理学。中药开发已有多年的历史,其特点是使用通常由两种或两种以上的草药组成的草药配方,这些草药能够通过潜在的协同草药相互作用系统地预防和治疗各种疾病。草药对涉及两种特定草药的独特组合,这构成了多草药疗法的最基本组成部分。我们调查了常见的中草药配方中出现的草药对的频率。我们开发了一个基于网络的模型,以表征蛋白质-蛋白质相互作用网络中草药对中草药之间的距离。该模型考虑了草药在草药,成分和目标水平上的相互作用,并利用了五个距离度量标准,包括最近,最短,单独,核和中心方法。此外,使用精确度和召回率(PR)的曲线下面积(AUC)以及接收器工作特性(ROC)来确定最佳距离度量,以区分最常见的草药对与不存在的草药对。二、研究方法
1、Collectionofherbpairs(草药对数据收集)
2、Extractionofinteractionsbetweenherbs,ingredientsandtargets(提取草药,成分和目标之间的相互作用)
3、Networkproximitymodelsofherbpairs(草药对的网络邻近度模型)
4、Discriminationperformanceoftheproximitydistances(接近距离的判别性能)
三、研究结果
1.单一草药和草药对的出现频率
TCMID数据库中总共有种草药和超过种草药成分。种草药成分对以及种成分-目标对。大多数草药配方(97.9%)包含少于20种草药,平均为4.93。频率最高的前10种草药为:甘草(甘草的根和根茎,12,),当归(当归的根,),人参(人参的根,),白术(,白术[Syn。Atractylismacrocephala]的根,黄岑(黄的根4),防风(,白僵菌的Saposhnikovia的根),川芎(,川gust的根茎)(Syn。Ligusticumwallichii)),茯苓(,Por的菌核),陈皮(,来自果皮的干燥果皮。前三种最常见的草药都倾向于激活免疫系统,这表明开出中药处方时必须激活免疫系统。该观察结果与中医理论相一致,在传统中医理论中,这些草药通常被称为补剂(佐剂),除了主要草药以外,还可以补充和增强治疗效果。在以下分析中,我们重点研究了这些顶级草药对,并搜索了它们的靶标和成分信息。这些草药对包含61种独特的草药,其平均成分数量为16.80。前种草药对中有43%有至少一种常见成分,而随机产生的草药对中只有2.08%共享至少一种成分。常见成分的使用往往是中药处方的一种策略。
图2.十种最常见草药的配对模式。草药的频率显示在顶部面板中,而与他们共同管理的内容显示在左侧面板中。热图内的数字表示它们成对组合的频率。2.常用草药对的网络距离
我们在两个水平上(包括成分和目标水平)对草药对的相互作用进行了建模。对于每个级别,我们考虑了五种距离方法,包括最接近,分离,最短,核和中心。在下一步中,我们检查了两个级别中距离度量的所有组合,得出总共25(5*5)个距离模型。与随机选择的草药对相比,我们集中研究了最常见的对草药对,并确定了它们基于网络的距离。我们发现,顶级草药对的平均网络距离大部分小于随机草药对的平均距离,在25个距离模型中的16个中具有统计学意义(P值0.05)(图3,表1)。
图3与随机草药对进行比较时,顶部草药对的网络距离。“I”代表成分级距离法,“T”代表成分级距离法目标水平距离方法。
表1比较网络邻近模型。P值由前种草药对与随机药草对之间的差值确定草药对。距离1、2、3、4是前个草药对,前个草药对,不重叠的个草药对和分别随机草药对。
3.距离指标的区分性能
为了评估网络模型的判别力,我们使用最常见的药草对作为阳性病例,使用随机的药草对作为阴性病例来确定ROC曲线和PR曲线。总的来说,我们发现25个距离度量的ROC曲线下平均面积(AUROC)和PR曲线之下的面积(AUPRC)分别达到0.65和0.72,这表明使用基于网络的距离度量来评估表征草药对相互作用(表1)。我们发现,通过在成分级别利用中心距离的两个模型可以实现最高性能,包括中心(成分)-分离(目标)模型和中心(成分)-最短(目标)模型。这两个模型的ROC曲线如图4所示,确认了出色的判别性能。
图4(A-B)中心分离模型和(C-D)中心最短模型的ROC曲线和精确调用曲线。每条曲线都是一个排列的结果蓝色曲线是所有排列的平均值。
有趣的是,我们发现五个模型利用成分级别的中心距离(即中心(成分)–中心(目标),中心(成分)–最接近(目标),中心(成分)–核(目标),中心(成分)–分离(目标)和中心(成分)–最短(目标))具有更好的判别性能,与其他模型相比,平均AUROC为0.80,平均AUPRC为0.83(图5)。与在成分级别使用其他距离度量不同,基于中心的模型涉及到对在草药成分网络中具有最短路径长度的最小总和的中心成分进行识别。因此,基于中心的距离模型的优越性能表明,药草对相互作用主要由确定为中心节点的少量成分驱动。这些拓扑上重要的成分可能是理解草药对相互作用的关键。
图5AUROC和AUPRC按成分的距离模型分组等级。统计显着性通过t检验确定。
4.草药对黄芪与甘草的结合机理
我们将网络药理学模型应用于草药对黄芪和甘草的研究。在本文中,我们提出了一种新颖的基于PPI的网络模型来描述草药对之间的相互作用。为了说明中药药理学的复杂性质,我们通过整合草药,成分和靶标之间的关系来开发网络距离指标。我们基于通常用于生物网络建模的多部分网络定义了药草之间的距离
我们的方法基于更深层的分子信息,例如草药成分,成分-目标和目标-目标之间的关系,这将提供对草药相互作用的更精确的表征。但是,我们的研究存在一些局限性,将来需要改进。例如,尽管知道草药中现有成分的存在,但实际上它们的实际浓度仍是未知的。因此,当前模型将每种成分均等地对待,这可能会导致某些偏差。此外,我们根据常用草药对的使用频率来确定它们的使用效果,而这可能不是最理想的。另外,可能有些组合的作用机制可能无法通过我们