基于谱图理论的本体相似度计算.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 理论 本体 相似 计算
- 资源描述:
-
1102011,47(28
Computer Engineering and Applicationsi计算机工程与应用
⊙数据库、信号与信息处理⊙
基于谱图理论的本体相似度计算
兰美辉',徐坚',孙瑜2
LAN Meihui",XU Jian, SUN Yu
1.胐师范学院计算机科学与程学院,云南曲蜻655011
2.云南师范大学计算机科学与信息技术学院,昆明650092
1. Department of Computer Science and Engineering, Qujing Normal University, Qujing, Yunnan 655011, China
2 Department of Computer Science and Information Technology, Yunnan Normal University, Kunming 650092, China
LAN Meihui, XU an, SU\ Yu Ontology similarity computation based on spectral graph theory. Computer Engineering
and Applications,201,47(28):110-11
Abstract: Research on semantic similarity of concepts is an important content in the fields of knowledge representation and
in ormation retrieval. It expresses information that is related to the ontology concept as a vector, and establishes an adjoin
graph for the original ontology graph. It defines the edge set with & -neighborhoods and the edge weights with the Gaussian
kernel function By computing the eigenvector that the second smallest eigcnvaluc of Laplacian matrix corresponds to, it can
get ontology similarity calculation function. Experimental results show that the algorithm is ef
Key words ontology; concept similarity; spectral aph theory Laplace Beltrami operator; Gaussian kere! function
摘要:概念的语义相似度研究,是知识東示以及信息检索领域中的一个重要内容。将与某概念相关的信息表示为一个向量,建
立原本体图的伴随图。用8-领域方法定义边,用高斯核函数定义边的权值。通过计算圈拉拉斯矩阵的次小特征值对应的特征
向量得到本体相似度计算函数。实验结果明该算法是有效的
关键词:本体;概念相似度;语图理论;拉普拉斯 Beltrami算子;高斯核函数
DOr:10.3776135102-833120128030文章号:100-9833(2011)28-01103文献标识码:A中图分类号:1P391
随着因特网技术的发展,网上信息量以指数规律迅速增其中a,①si≤4)是由领域专家或经验值决定的参数,满足a+
长。如何准确地获得有价值的劇上信息资源,怎样对日益庞a2+q3+a,=1。即A、B的相似度由它们的名称、结构、实例、属
大的数据、信息进行处理快速、准強地找到符合用户需求的性四个方面的相似度加权得到。而在每个方面局部相似度计
信息成为当今信息领域的研究热点。概念是组成信息的基本算公式中,又会出现其他的需要领域专家确定的参数。将a
单位,因此概念之间语义相似度的计算精确度对信息检索的asi≤4以及局部相似度计算公式中作为系数的参数称为第
效率起着决定作用。
类参数,而将嵌入到局部栢似度计算公式内部的参数称为
本体( Ontology)-词来源于哲学领域,用来描述事物的本第二类参数(例如,出现在某个局部相似度计算公式分母中的
质?。在计算机科学领域,本体波定义为共享概念模型的形式调节因子)。模型(1)的缺陷在于:(1)所有参数都需要由领域
化规范说明"?本体中两个概念A、B的相似度记为sin(a,B),专家或经验给出,而不是由本体自身决定。当无法找到领域
取偵[0,1之间。Sm(A,B)=1,表示4和所代表的概念是两专家且白身经验不足时,将尤法给出适合某项应用的合理参
个完全相同的:siw(4,B)-0,表示A和8所代表的概念尤任何联数。(2)需要成对地计算相似度,直观性差,且计算量大。
系。设定遡值M,当Sim(A,B)>M,认为A,B之j的相似度大于M
针对上述问题,本文突破传统计算模型参数人为确定的
制约,给出一种基于谱图理论的本体相似度计算方法,避免了
1向題的引入
人为设定第一类参数,并且新算法无需两两计算相似度。该
本体相似度计算是近年来的热题。关于本体相似度方法的核心思想是:根据原有本体图生成一个伴随图,两图的
计算,多种有效计算方法脱颖而出,并在特定的应用领域获待顶点集相同。将原本体图中某个顶点的信息(结构、实例、属
了成功。归纳起来,这些计算方法沿用了如下模式:
性等)数值化,用一个行向量裁示,并将该向量作为该顶点在
Sim(4A, B)=a Sim(A,B)a Sima(4, B)+
伴随图中的坐标。用8-领域方法定义边,用高斯核函数定义
a3Sima(A,B)+ a, Sixaenere(A,B)(1)边的权值。寻找最优相似度计算函数八(可看成一个列向
基金项月:国家自然科学基金( the National Natural Science Foundation of China under Grant No,60903131)。
作者简介:兰美辉(1982-),女,助教,主要从事信息检索算法研究;徐坚(1976~-),男,讲师;孙瑜(1974~),博士。E-mail:lanmeihui97@l63.com
收稱日期:2010-07-19:回日期:2010-09-08
万方数据
展开阅读全文
文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。



链接地址:https://www.wdfxw.net/doc35439106.htm