原始数据的扫描索引
正如Google、百渡扫描整个互联网,Chrawler扫描内部原始数据,为文字和所包含的化学结构建立可高速搜索的索引
下列数据源可以被索引:
索引的检索:
•网络服务器上的文件•ELN数据库•SharePoint数据库•其他 Oracle, SQL Server 数据库
•化学结构检索:子结构、全结构、相似结构•生物序列检索•文字检索•结构和文字的组合检索•文件出处页面的预览•导出一个文档中所有结构•标记、共享、存储、显示过去的查询
下列数据类型可以建立化学索引:
软件开发接口:
•Office文件:Word, Excel, PowerPoint,
OneNote•化学数据文件:SMILES, InChI, Molfile, Rxnfile, TGF, CML, ChemDraw, ISIS/Draw, Symx(Accelrys)/Draw, Marvin, JSDraw, TouchMol•化学名称:IUPAC, 系统名称,俗名•化合物编号•PDF和化学图片(需要第三方图形识别软件)•专利、文献
•JSON和SOAP软件接口•可第三方集成的查询•可自定义的文件预览•可自定义的文件读取•可自定义的数据源扫描•可扩展的数据源