语意技术

我们的语意技术由七大部分即:

A)根据行业建立规范的知识本体;

B)基于知识本体的结构化数据与非结构化数据(文本)的整合;

C)理解真实文本的自然语言理解系统;

D)文本语意自动标注系统;

E)建立实体与实体间关系的FactBase;

F)基于知识本体的专业领域的语意搜索;

G)专业知识本体的远程合作编辑系统组成。

        这个系统能够在中、英文的文本中自动建立新一代互联网(Web3.0)的知识表达内容(RDF)系统框架,利用已有知识分类系统,建立语意资料知识库,动态更新充实语意资料信息库。

        语意生物的自然语言理解目前从理解广度和深度上是一个最强大的语言理解技术系统。该技术系统所提供的语意搜索能支持开发远比谷歌、百度为代表的现有的关键词搜索技术更智能、精确、适合人的使用模式的知识管理系统或搜索系统,从而能够带来搜索技术和服务的革命性创新,使获取知识的过程更符合人们认知思维习惯,适应人的需求,以准确和快捷的方式获取或搜索到需要的信息,将人从信息海洋中解救出来。

        语意生物的核心技术能够支持中、英文文本处理,在各个专业知识领域内具有强大的应用和适应能力,能够成为各个专业领域的知识管理系统和垂直搜索引擎。同时,具备了建立面向全体受众的下一代的语意搜索引擎(Semantic Search Engine)核心技术条件。核心技术和产品服务具有几何级数增长的能力。

        第三代互联网(Web 3.0),即语意网(Semantic Web),是互联网之父蒂姆•伯纳斯-李(Tim Berners-Lee)在1998年提出,其核心是:通过给互联网上的文档(如HTML)添加能够被计算机所理解的语意(Meta data),从而使整个互联网成为一个通用的信息交换媒介。语意网通过使用标准、置标语言和相关的处理工具来扩展互联网的能力。语意网最基本的元素就是语意链接。语意网技术的发展将给互联网带来革命性的变革。虽然从总体上说,语意网从理论到技术还在逐步发展完善,还有待形成服务和消费的环境和习惯,但为了解决人们在海量信息中出现的巨大地被淹没的危机,许多著名研究机构和公司还是投入了大量的人力和资金开发语意网的技术和应用。