剑桥结构数据库系统(The Cambridge Structural Database System)
剑桥结构数据库(CSDS)收录了全世界范围内所有已认可的有机、及金属有机化合物的晶体结构。通过一整套丰富的搜寻与分析工具及衍生的数据库,用户可以进行分子结构,分子间相互作用以及晶胞堆积的研究,从而为许多先进领域的研究与应用提供方便。
剑桥结构数据库含有将近五十万个有机和金属有机化合物的X-射线和中子射线衍射的分析数据。本数据库不仅全面涵盖了已发表的分子晶体结构,同时也独特的收录了大量在其它任何地方无法获得的分子结构数据。
本数据库中所有的分子结构都经过了广泛、仔细的查证并提供了详尽的化学和文献方面的信息,从而更加提高了晶体结构数据的价值。本数据库一直在根据新发表和新存入的数据不断更新(年增长率约
8%),同时也在不断完善已有的数据记录。本数据库每年发布一次,定期更新可通过互联网下载。
剑桥数据库系统的应用范围:
- 搜寻与图像显示晶体结构
- 分析分子参数
- 研究构像取向
- 探索药效团模型
- 检测分子内和分子间相互作用
- 快捷地提取与分析分子的几何结构
- 预测分子间相互作用
- 确认特定官能团间相互作用的模式
- 检索相似的京胞堆积特性
- 计算晶胞堆积相似度
剑桥数据库系统由以下六部分组成:
剑桥结构数据库中的每项输入都包括以下内容:
- 三维结构数据:原子坐标,晶胞参数,空间群,结构精密度指标,温度与压力条件,无序分布细节
- 二维结构图:原子和键的性质与关联
- 化学式和化合物名称,多肽化合物的氨基酸序列
- 完整的文献资料,其中部分直接与电子版文献链接
- 交叉引用立体异构体及有关重新解释和确认的详情
- 其他已发表的与该分子有关的信息:
——化合物来源
——结晶条件
——绝对构型的确定实验
——多晶型现象(同质多象)
——生物活性
PreQuest
PreQuest可方便用户构建自己专用的晶体结构数据库,然后可对
该数据库用ConQuest独立或与CSD相结合进行搜索。在正式把一
个警惕数据库编入CSD数据库前,剑桥晶体数据中心(Cambridge
Crystallographic Data Centre,CCDC)的编辑们用PreQuest来检查验
证每一个要存入数据库的晶体结构。PreQuest的性能包括:
- 认可一系列的数据输入格式(CIF,SHELX,MOL,MOL,MOL2和CCDC的BCCAB格式)
- 简便的对文字和数字的修饰功能
- 可根据三维晶体结构自动显示二维化学结构图
- 二维化学结构图编辑功能
- 显示,验证和编辑三维结构数据
- 可将已验证的数据以CSD格式输出以建立用户自己专用的数据库
文字、亚结构与几何结构查询
ConQuest
ConQuest是用于从剑桥结构数据库搜索和提取结构信息的基础软件。该软件日工在剑桥结构数据库中全方位的文字与数字查询,同时还具有更高级的搜索功能:
- 化学亚结构的搜索
- 几何结构的搜索
- 分子间和分子内相互关系的搜索
对于所查询的每个三维化学亚结构,ConQuest可帮助用户定义,
提取和输出与之对应的一系列几何参数,并直接与Mercury相链接
以显示选中的结构,或者与Vista链接以分析和显示所提取的几何数
据。ConQuest功能包括:
- 全方位的文字与数字搜索选择,包括文献与实验细节
- 含有能直接输入命令的界面以实现批量查询的功能
- 与电子版文献资源直接链接
- 化合物名称,化学式,和元素组成的搜索
- 二维化学亚结构画图功能,可界定一系列的成键约束条件(图4)
- 可直接从ChemDraw和SIS/Draw剪贴二维结构图
- 三维几何搜索一确定药效团模型,其分子内氢键和特定的构象
- 三维搜索分子间非共价键接触,如:氢键,偶极相互作用
- 提取二维和三维化学亚结构的几何数据
- 提供简便的机制用于合并不同的查询方式使其升级为更高级的查询
- 对选中的化合物列表进行管理,可合并及注释搜索结果
- 提供多种文件输出格式(包括CIF,PDB,MOL2,PDF,MOL)
- 完善的产品介绍文件,使用指南及对相关内容的引导
ConQuest在教学中的使用
Classroom ConQuest 是为帮助群体教学活动所设计的。任何
ConQuest的用户均可根据需要无限量安装Classroom ConQuest 软件。
Classroom ConQuest 拥有 ConQuest 的所有功能,可被用于搜寻CSD
的一个子集(可与Classroom ConQuest一起提供)或用于搜寻用户自
己通过CSD建立的子数据库。
晶体结构开发与数据显示
Mercury
Mercury 提供了一整套丰富的软件工具用于显示及比较晶体与分子结构,
从而探索分子网络与晶胞堆积。Mercury的性能包括:
- 多种结构显示选择和图像操作功能,包括各项异性热参数的椭球位移模型(图7)
- 计算及显示几何参数
- 定位及显示氢键及其他短距离相互作用(图8)
- 基于分子间相互联系的网络扩展与探索
- 具有创建与显示几何中心,最小二乘法均面以及密勒晶面的功能
- 显示晶胞参数,并可向任意方向扩展晶胞数,及晶体中任意方向的切面内容
- 模拟并输出多晶(粉末)衍射图像
- 2007及更高版本可与MOPAC兼容,提供以分子为基础的气相计算
- 具有多种保存和输出格式的选项,可直接输出至POV-Ray
- 可同时显示多个结构,并对这些结构应用最小二乘法进行叠加比较
- 可编辑晶体结构,包括‘一键’设定健型及添加缺失的氢原子
- 在硬件条件允许的情况下,可显示立体视图
- 显示空间群对称元素(图9)
- 直接链接到分子间及分子内的几何结构数据库(Mogul和Isostar)
一个新投入使用的功能模块Materials模块为您进行如下操作提供了方便:
- 比较及量化结构间晶胞堆积的相似性
- 识别结构中相似的区域
- 在一系列的结构中搜寻特定形式的相互作用,或者综合的晶胞堆积特性,并对它们的几何特征进行比较
VISTA
VISTA是一个互动的分析与统计软件,可阅读用户自定义的几何数据和
其它通过ConQuest从CSD中提取的数字信息。VISTA的性能包括:
- 以电子数据表格的形式显示所提取的参数
- 简便地用笛卡尔坐标(Cartesian)或极性轴构建参数分布的柱状或散点图
- 参数分布的简要统计学描述
- 图表与CSD中搜寻结果之间的超级链接
- 对现存参数进行数学组合处理以产生新的参数
- 数理统计分析功能包括线性回归与主体组分分析
- 制备用于发表文章和报告的图表
分子几何结构与非键相互作用
Mogul
只需点击一下,Mogul即可迅速从CSD中几百万个各类化学键长,键角和非环扭转角数据中提取信息以便快捷地显示分子的几何结构。应用范围包括验证新的晶体结构,发现非同寻常的几何特性,查证通过计算而得到的构象(如过滤筛选蛋白质—配体嵌合模拟的结果以便去除不可能的配体构象),及建立配体库用于蛋白质晶体结构的精调。
Mogul的性能包括:
- 认可各种文件输入格式(MOL2,CIF,RES,MOL,PDB),并可构建二维分子图
- 快捷的几何性能选择及自动构建搜索目标亚结构(图11)
- 随时快速提取几何数据信息,将所得结果以柱形图形显示,同时给出详细的统计学描述(图12)
- 直接察看柱形图中的CSD分子结构
- 根据实验精度(R-因子)筛选过滤所得结果
- 片段构建,从CSD中含有紧密相关片段的结构中添加数据
- 只需点击一下即可获取关于某一分子的所有化学键长。键角,及非环扭转角的数据
通过指示文件界面整合客户端应用
Mogul已经成功进行了与CRYSTALS(用于单晶X射线结构精调)和DASH(用于从粉末衍射的数据进行晶体结构解析)的整合
IsoStar
IsoStar 可提供对收集在CSD和PDB实验数据库中的非键相互作用的几何参数信息的快速访问。对于一个中央基团(A)和一个接触基团(B)之间的相互作用,IsoStar可通过叠加基团A的单体,以三维散点分布图的形式显示出B在A周围的分布(图13)。通过3D散点图可以查看收集在CSD中超过2万2千多种,和在PDB中大约7千4百多种化学功能基团对。散点图的等值线可表征结合热点,及任意指定的某种接触出现的可能性。IsoStar的性能包括:
- 具有用于选取化学功能基团的网页浏览器界面
- 可以选择基于CSD或PDB构建的散点分布图
- 1550种最低势能计算值
- 定义接触距离的显示限度
- 允许用户自行定义散点图密集度
- 提供散点图中各个点与CSD或PDB中相关结构的超级链接
- 提供特定接触的几何参数的报告
用户自定义的功能基团组合散点图如不被IsoStar所涵盖,可使用IsoGen(和IsoStar一起提供)构建。