当前位置:无忧公文网 >范文大全 > 征文 > 知识库系统在智能搜索引擎中的应用

知识库系统在智能搜索引擎中的应用

时间:2022-03-22 09:11:28 浏览次数:

摘要:从智能搜索引擎的功能特点入手,探讨了知识库系统在智能搜索引擎中的应用。

关键词:智能搜索引擎;知识库

中图分类号:TP31 文献标识码:A

互联网从产生到飞速发展的近十年里,给现代社会的方方面面带来了无法估量的影响。随着网站页面的激增和用户队伍的不断壮大,搜索引擎越来越成为人们上网浏览时的重要工具。从用户的角度来看,当前的搜索引擎存在着信息检索质量不高、检索方式单一、标引深度浅、缺乏个性化等诸多的问题。于是新一代带有明显的智能特征的自动搜索引擎技术应运而生。

1 智能搜索引擎的功能特点

智能搜索引擎具有智能型的自然语言技术、灵活的检索机制、广泛的整合支持能力以及强大的索引功能等特点。它的人机接口和网络蜘蛛高度智能化,可跨平台工作、处理多种混合文档、支持多种语言搜索,并能根据用户的个性化需求,不断实时推荐、推送相关的信息,表现出较大的智能性、主动性、交互性、人性化特征。使其用户范围从具有良好信息检索素质的专业人士,扩展到无任何检索技能背景的普通用户。

2 知识库系统在智能搜索引擎中的应用

2.1 知识库系统的原理

2.1.1 知识的定义

知识是人类对客观世界的认识,通常知识是先由底层数据经过分类、归纳、综合等处理过程而得到的上层信息,这种信息再经过解释、比较、推理得到我们所获取的知识,这种过程主要是在语义的层面来进行的。抽象地说,知识是由有名论域内容和有名论域内容之间关联的符号来表示的。

2.1.2 知识的类型

知识的类型分为过程型知识、描述型知识以及元知识等。

2.1.3 知识的表示

知识表示是指知识在计算机内部的存储和组织,是数据结构和解释过程的结合。数据结构用于知识的形式化描述,而解释过程则用来说明知识的现实含义。知识的表示方法主要有一阶谓词逻辑表示法、产生式表示法、语义网络表示法和面向对象的知识表示方法等。

2.1.4 知识库

知识库是关于某一领域的陈述性知识、过程性知识和策略性知识的集合。在该集合中各类知识通过一定的表示方法表示,并建立相互之间的联系。知识库中不但包含了大量的简单事实。还包含了规则、过程型知识和策略性知识。从存储知识的角度来看,以描述型方法来存储和管理知识的机构叫做知识库。从使用知识的角度来看,知识库是由知识和知识处理机构组成。

2.1.5 知识库系统

2.1.5.1 知识库系统的体系结构 知识库系统包括知识的获得、利用和管理三个方面,知识的获得,也称为机器学习,就是取得新的知识信息并使其体系化,知识的利用就是推理。知识库、推理机构及存贮器是知识库系统的三个组成要素。其中推理机构能模拟决策者的思维过程,并根据决策者的需求,通过提问会话与分析问题,应用有关规则引导决策者选择合适的模型。知识库系统的核心组成部分是知识库和推理机构。知识库是以一致的形式存储知识的机构,推理机构则是为了使用知识库内的知识执行推理的控制机构。

2.1.5.2 推理机构

利用知识,解释输入的数据或事实,推导出用户所需的结论;并根据要求,说明得出结论的依据,用于进行这种推理控制的模块称为推理机构。

推理机构应具备以下四个功能:①识库中新知识的获取功能。②理机构与知识库相互独立功能。③识库中信息交换及知识扩充功能。④识库与待解决问题之间的协调功能。

2.2 在智能搜索引擎中的应用

下面就是当前智能搜索引擎在知识库系统中所采用的一些自然语言理解技术。

2.2.1 智能分词技术

关键词查询的前提是将查询条件分解成若干关键词。对英文而言,一个单词就是一个词,但中文词之间的关系却复杂得多,主要问题是中文词与词之间没有界定符需要人为但人为的切分有很大的灵活性和操作性,往往容易产生词义失真。除此之外。汉语中存在大量的歧义现象,简单的分词往往会完全曲解甚至误解用户查询的真正意图,造成误检和漏检。因此,可以利用语义知识库进行总结,获得每个词出现的概率以及词与词之间的关联信息,就可能有效地排除各种歧义,大幅度提高分词的准确性。

2.2.2 同义词处理

汉语词语之间复杂性的另一个方面是同义词的问题。处理同义词的一种方法是在语义知识库中人工构造同义词表对专用领域的搜索引擎,这种方法是非常有效的。另外一种方法是从语义知识库中自动取得同义词关系,给出一个查询的关键词引擎能主动“联想”到与其同义或意思相近的词。

2.2.3 短语识别技术

用短语描述查询请求的情况很常见,但是因为汉语词组的复杂性,所以在中文搜索引擎中,我们不能象英文词组一样简单的将中文短语分离成词组。譬如查询条件“新乡的大学”,“新乡”和“大学”存在一定的关系,但如果不将“新乡”和“大学”联合起来作为一个短语查询,那么除了选出关于“新乡的大学”的文档之外,还将查出有关“新乡”和“大学”的冗余文档。因此,短语识别是智能化搜索引擎亟待的一个重要问题。

2.2.4 智能搜索代理技术

以提供主动服务为主的智能搜索代理技术,能够将信息主动推送到用户面前,免去了用户被动搜索的困扰。搜索的是活动窗口而不是某一个关键词的主导概念增强了相关性提供的链接。除网络信息外,还包括客户端的本地内容、相关内容的参考资料等。

3 结束语

智能搜索引擎能够实现信息服务的人性化、高效化,为用户检索互联网信息提供了极大的便利。在应用需求和相关科学技术的推动下,它将会越来越好地为人们的生活服务。

推荐访问: 知识库 搜索引擎 智能 系统