药物评价指标
时间:2022-11-13 17:00:00
药物评价指标
定量估计药物相似性(QED)
该概念由 Richard Bickerton 及其同事首次介绍 [1]。
QED 测量的经验原理反映了分子性质的基本分布,包括分子量、logP、拓扑极性表面积、氢键供体和受体的数量、芳环和可旋转键的数量以及不必要的化学官能团的存在。
由基于 RDKit 的 Biscu-it? 实现生成的QED原始出版物的结果 [1] 结果并不完全相同。这些差异是两种方法中使用的基本计算属性计算器内部差异的结果。例如,在 logP 虽然这两种方法(原始出版物中的差异)可以在计算结果中注意到 Pipeline Pilot 和我们的 Biscu-it? 实现中的 RDKit)都提到使用 Wildman 和 Crippen 计算它们的方法 logP 值 [2]。但是,所得 QED 价值差异很小,不会影响日常研究的使用 Qed 的有用性。
[1] Bickerton, G.R.; Paolini, G.V.; Besnard, J.; Muresan, S.; Hopkins, A.L. (2012)
‘Quantifying the chemical beauty of drugs’, Nature Chemistry, 4, 90-98 [https://doi.org/10.1038/nchem.1243]
[2] Wildman, S.A.; Crippen, G.M. (1999)
‘Prediction of Physicochemical Parameters by Atomic Contributions’, Journal of Chemical Information and Computer Sciences, 39, 868-873 [https://doi.org/10.1021/ci990307l]
实际确定QED在定义时,有必要确定每个描述符的权重。确定该系数,以最大限度地发挥香农文(可由QED解释的信息量),并考虑以下三种情况。
- QED w,max:给出最大烯系数
- QED w,mo:给出前1000个系数的平均值
- QED w,u:所有描述符都等同于(系数为1).0)在QEDw,max的情况下,PSA和HBA系数为零。也就是说,建议所包含的信息由其他描述符覆盖。本文的主要成分分析为此提供了支持。
在QEDw,max的情况下,PSA和HBA系数为零。也就是说,建议所包含的信息由其他描述符覆盖。本文的主要成分分析为此提供了支持。
基于RDKit计算QED
from rdkit import rdBase, Chem from rdkit.Chem import PandasTools, QED, Descriptors, rdMolDescriptors %matplotlib inline print(rdBase.rdkitVersion) df = PandasTools.LoadSDF('structures.sdf') len(df) ## 计算QED df['QED'] = df.ROMol.map(QED.qed) ## 定义Lipinsky def rule_of_five(m): mw = Descriptors.MolWt(m) logp = Descriptors.MolLogP(m) hbd = rdMolDescriptors.CalcNumLipinskiHBD(m) hba = rdMolDescriptors.CalcNumLipinskiHBA(m) psa = Descriptors.TPSA(m) if (mw <= 500 and logp <= 5 and hbd <= 5 and hba <=10):
return 1
else:
return 0
## 绘图
import matplotlib as mpl
import seaborn as sns
with mpl.style.context('seaborn'):
sns.violinplot(x='Lipinski', y='QED', data=df)
参考
https://blog.csdn.net/u012325865/article/details/101111516