关于SDF介绍
时间:2022-08-30 09:00:00
来源:分子动力学微信官方账号
链接:https://mp.weixin.qq.com/s/kMwnIbuiTE-LsXGYQonedQ
简单来讲,SDF文件是化学表格文件。
文件扩展名:.sd,.sdf。格式类型:化学文件格式
SDF是MDL一系列化学数据文件格式的开发;它专门用于结构信息。 SDF代表结构数据文件,SDF文件实际上是包装的molfile(MDL Molfile)格式($$$$)组成的线分隔。SDF格式的一个功能是它包含相关数据的能力。相关数据项表示如下:
第一行:一般作为分子名称,如 Levetiracetam
第二行:注释,ChemDraw06111413562D
第三行:一般为空行
第四行:原子数 开始行的键数等。
M END行结束时原子数 键数等信息。
属性1 属性1值
空行
属性2 属性2值
空行 (以四个美元符号结束一个分子的信息存储。
具体例子:
Levetiracetam ChemDraw06111413562D 12 12 0 0 0 0 0 0 0 0999 V2000 -1.4405 -0.4285 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 -0.7260 -0.8410 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 -0.0116 -0.4285 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 0.7029 -0.8410 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1.4174 -0.4285 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 -0.0116 0.3965 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0 -0.7260 -1.6660 0.0000 N 0 0 0 0 0 0 0 0 0 0 0 0
0.6559 0.8814 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
0.4009 1.6660 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-0.4241 1.6660 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
-0.6790 0.8814 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.4405 0.6265 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
1 2 2 0
2 3 1 0
3 4 1 1
4 5 1 0
3 6 1 0
2 7 1 0
6 8 1 0
8 9 1 0
9 10 1 0
10 11 1 0
11 6 1 0
8 12 2 0
M END
> <Catalog Number> (1)
A1198
> <Item Name> (1)
Levetiracetam
> <Formula> (1)
C8H14N2O2
> <MolWeight> (1)
170.21
> <CAS Number> (1)
102767-28-2
> <Target> (1)
Cancer Biology
$$$$
某些可以导入SDF文件的程序(例如ISIS / Base)要求分子数据之后的第一个数据字段(在上面的示例中为Unique_ID)是每个记录的唯一标识符。
多行允许有多个数据项。[需要澄清] MDL SDF格式规范要求将硬回车字符插入内容超过200个字符的任何文本字段中。由于许多SMILES和InChI字符串超过该长度,因此在实践中经常违反此要求。