logo

 

p7

 

原始数据的扫描索引

正如Google、百渡扫描整个互联网,Chrawler扫描内部原始数据,为文字和所包含的化学结构建立可高速搜索的索引

 

下列数据源可以被索引:

索引的检索:

•网络服务器上的文件
•ELN数据库
•SharePoint数据库
•其他 Oracle, SQL Server 数据库

•化学结构检索:子结构、全结构、相似结构
•生物序列检索
•文字检索
•结构和文字的组合检索
•文件出处页面的预览
•导出一个文档中所有结构
•标记、共享、存储、显示过去的查询

下列数据类型可以建立化学索引:

软件开发接口:

•Office文件:Word, Excel, PowerPoint,

OneNote
•化学数据文件:SMILES, InChI, Molfile, Rxnfile, TGF, CML, ChemDraw, ISIS/Draw, Symx(Accelrys)/Draw, Marvin, JSDraw, TouchMol
•化学名称:IUPAC, 系统名称,俗名
•化合物编号
•PDF和化学图片(需要第三方图形识别软件)
•专利、文献

•JSON和SOAP软件接口
•可第三方集成的查询
•可自定义的文件预览
•可自定义的文件读取
•可自定义的数据源扫描
•可扩展的数据源