CSD

剑桥结构数据库系统(The Cambridge Structural Database System)

 

        剑桥结构数据库(CSDS)收录了全世界范围内所有已认可的有机、及金属有机化合物的晶体结构。通过一整套丰富的搜寻与分析工具及衍生的数据库,用户可以进行分子结构,分子间相互作用以及晶胞堆积的研究,从而为许多先进领域的研究与应用提供方便。

         剑桥结构数据库含有将近五十万个有机和金属有机化合物的X-射线和中子射线衍射的分析数据。本数据库不仅全面涵盖了已发表的分子晶体结构,同时也独特的收录了大量在其它任何地方无法获得的分子结构数据。

         本数据库中所有的分子结构都经过了广泛、仔细的查证并提供了详尽的化学和文献方面的信息,从而更加提高了晶体结构数据的价值。本数据库一直在根据新发表和新存入的数据不断更新(年增长率约

8%),同时也在不断完善已有的数据记录。本数据库每年发布一次,定期更新可通过互联网下载。


剑桥数据库系统的应用范围:

  • 搜寻与图像显示晶体结构
  • 分析分子参数
  • 研究构像取向
  • 探索药效团模型
  • 检测分子内和分子间相互作用
  • 快捷地提取与分析分子的几何结构
  • 预测分子间相互作用
  • 确认特定官能团间相互作用的模式
  • 检索相似的京胞堆积特性
  • 计算晶胞堆积相似度

 剑桥数据库系统由以下六部分组成:


剑桥结构数据库中的每项输入都包括以下内容:

  • 三维结构数据:原子坐标,晶胞参数,空间群,结构精密度指标,温度与压力条件,无序分布细节
  • 二维结构图:原子和键的性质与关联
  • 化学式和化合物名称,多肽化合物的氨基酸序列
  • 完整的文献资料,其中部分直接与电子版文献链接
  • 交叉引用立体异构体及有关重新解释和确认的详情
  • 其他已发表的与该分子有关的信息:

    ——化合物来源

    ——结晶条件

    ——绝对构型的确定实验

    ——多晶型现象(同质多象)

    ——生物活性

PreQuest

PreQuest可方便用户构建自己专用的晶体结构数据库,然后可对

该数据库用ConQuest独立或与CSD相结合进行搜索。在正式把一

个警惕数据库编入CSD数据库前,剑桥晶体数据中心(Cambridge

Crystallographic Data Centre,CCDC)的编辑们用PreQuest来检查验

证每一个要存入数据库的晶体结构。PreQuest的性能包括:

  • 认可一系列的数据输入格式(CIF,SHELX,MOL,MOL,MOL2和CCDC的BCCAB格式)
  • 简便的对文字和数字的修饰功能
  • 可根据三维晶体结构自动显示二维化学结构图
  • 二维化学结构图编辑功能
  • 显示,验证和编辑三维结构数据
  • 可将已验证的数据以CSD格式输出以建立用户自己专用的数据库

文字、亚结构与几何结构查询

ConQuest

ConQuest是用于从剑桥结构数据库搜索和提取结构信息的基础软件。该软件日工在剑桥结构数据库中全方位的文字与数字查询,同时还具有更高级的搜索功能:

  • 化学亚结构的搜索
  • 几何结构的搜索
  • 分子间和分子内相互关系的搜索

对于所查询的每个三维化学亚结构,ConQuest可帮助用户定义,

提取和输出与之对应的一系列几何参数,并直接与Mercury相链接

以显示选中的结构,或者与Vista链接以分析和显示所提取的几何数

据。ConQuest功能包括:

  • 全方位的文字与数字搜索选择,包括文献与实验细节
  • 含有能直接输入命令的界面以实现批量查询的功能
  • 与电子版文献资源直接链接
  • 化合物名称,化学式,和元素组成的搜索
  • 二维化学亚结构画图功能,可界定一系列的成键约束条件(图4)
  • 可直接从ChemDraw和SIS/Draw剪贴二维结构图
  • 三维几何搜索一确定药效团模型,其分子内氢键和特定的构象
  • 三维搜索分子间非共价键接触,如:氢键,偶极相互作用
  • 提取二维和三维化学亚结构的几何数据
  • 提供简便的机制用于合并不同的查询方式使其升级为更高级的查询
  • 对选中的化合物列表进行管理,可合并及注释搜索结果
  • 提供多种文件输出格式(包括CIF,PDB,MOL2,PDF,MOL)
  • 完善的产品介绍文件,使用指南及对相关内容的引导

 

ConQuest在教学中的使用
Classroom ConQuest 是为帮助群体教学活动所设计的。任何

ConQuest的用户均可根据需要无限量安装Classroom ConQuest 软件。

 

Classroom ConQuest 拥有 ConQuest 的所有功能,可被用于搜寻CSD

的一个子集(可与Classroom ConQuest一起提供)或用于搜寻用户自

己通过CSD建立的子数据库。

 


晶体结构开发与数据显示

Mercury

Mercury 提供了一整套丰富的软件工具用于显示及比较晶体与分子结构,

从而探索分子网络与晶胞堆积。Mercury的性能包括:

  • 多种结构显示选择和图像操作功能,包括各项异性热参数的椭球位移模型(图7)
  • 计算及显示几何参数
  • 定位及显示氢键及其他短距离相互作用(图8)
  • 基于分子间相互联系的网络扩展与探索
  • 具有创建与显示几何中心,最小二乘法均面以及密勒晶面的功能
  • 显示晶胞参数,并可向任意方向扩展晶胞数,及晶体中任意方向的切面内容
  • 模拟并输出多晶(粉末)衍射图像
  • 2007及更高版本可与MOPAC兼容,提供以分子为基础的气相计算
  • 具有多种保存和输出格式的选项,可直接输出至POV-Ray
  • 可同时显示多个结构,并对这些结构应用最小二乘法进行叠加比较
  • 可编辑晶体结构,包括‘一键’设定健型及添加缺失的氢原子
  • 在硬件条件允许的情况下,可显示立体视图
  • 显示空间群对称元素(图9)
  • 直接链接到分子间及分子内的几何结构数据库(Mogul和Isostar)

 

一个新投入使用的功能模块Materials模块为您进行如下操作提供了方便:

  • 比较及量化结构间晶胞堆积的相似性
  • 识别结构中相似的区域
  • 在一系列的结构中搜寻特定形式的相互作用,或者综合的晶胞堆积特性,并对它们的几何特征进行比较

 

VISTA

 VISTA是一个互动的分析与统计软件,可阅读用户自定义的几何数据和

其它通过ConQuest从CSD中提取的数字信息。VISTA的性能包括:

  • 以电子数据表格的形式显示所提取的参数
  • 简便地用笛卡尔坐标(Cartesian)或极性轴构建参数分布的柱状或散点图
  • 参数分布的简要统计学描述
  • 图表与CSD中搜寻结果之间的超级链接
  • 对现存参数进行数学组合处理以产生新的参数
  • 数理统计分析功能包括线性回归与主体组分分析
  • 制备用于发表文章和报告的图表

分子几何结构与非键相互作用

Mogul

只需点击一下,Mogul即可迅速从CSD中几百万个各类化学键长,键角和非环扭转角数据中提取信息以便快捷地显示分子的几何结构。应用范围包括验证新的晶体结构,发现非同寻常的几何特性,查证通过计算而得到的构象(如过滤筛选蛋白质—配体嵌合模拟的结果以便去除不可能的配体构象),及建立配体库用于蛋白质晶体结构的精调。

Mogul的性能包括:

  • 认可各种文件输入格式(MOL2,CIF,RES,MOL,PDB),并可构建二维分子图
  • 快捷的几何性能选择及自动构建搜索目标亚结构(图11)
  • 随时快速提取几何数据信息,将所得结果以柱形图形显示,同时给出详细的统计学描述(图12)
  • 直接察看柱形图中的CSD分子结构
  • 根据实验精度(R-因子)筛选过滤所得结果
  • 片段构建,从CSD中含有紧密相关片段的结构中添加数据
  • 只需点击一下即可获取关于某一分子的所有化学键长。键角,及非环扭转角的数据

通过指示文件界面整合客户端应用

Mogul已经成功进行了与CRYSTALS(用于单晶X射线结构精调)和DASH(用于从粉末衍射的数据进行晶体结构解析)的整合

IsoStar

IsoStar 可提供对收集在CSD和PDB实验数据库中的非键相互作用的几何参数信息的快速访问。对于一个中央基团(A)和一个接触基团(B)之间的相互作用,IsoStar可通过叠加基团A的单体,以三维散点分布图的形式显示出B在A周围的分布(图13)。通过3D散点图可以查看收集在CSD中超过2万2千多种,和在PDB中大约7千4百多种化学功能基团对。散点图的等值线可表征结合热点,及任意指定的某种接触出现的可能性。IsoStar的性能包括:

  • 具有用于选取化学功能基团的网页浏览器界面
  • 可以选择基于CSD或PDB构建的散点分布图
  • 1550种最低势能计算值
  • 定义接触距离的显示限度
  • 允许用户自行定义散点图密集度
  • 提供散点图中各个点与CSD或PDB中相关结构的超级链接
  • 提供特定接触的几何参数的报告

用户自定义的功能基团组合散点图如不被IsoStar所涵盖,可使用IsoGen(和IsoStar一起提供)构建。