ResearchPage.
SpatialInformationRetrieval
Last modified by xuehu on Mar 14, 2007 at 09:46:15 AM
首页 | 科研 | 开发 | 课程 | RSS | 留言板 | 联系我们 | 帮助 | 地图 | English

空间信息检索小组

研究内容简介

信息检索是近来的热门研究领域之一,互联网搜索引擎是信息检索技术的亮点应用。信息检索技术中最普遍的矢量模型把每个文档看作是一个高维空间中的矢量,各个维度对应组成文档的各个(筛选后的)单词。用户的检索请求也可以被分解和表达为高维空间中的一个矢量。检索是通过计算和比较检索请求矢量和数据库中各个文档矢量的相似度完成的。各种算法的区别往往体现在从文档(请求)向矢量的转化过程中,以及不同矢量的相似度计算算法中。我们可以看出这个模型和人类语言的内在复杂度是有明显的反差的,但其在信息检索应用中的优秀表现,不得不使我们重新审视语义的本质。
空间信息在这里主要指的是带有空间语义的自然语言,如相对规范的地址和地名,以及往往很不规范的空间位置的自然语言描述。这和业界公认的空间信息的定义显然不同。主要原因是我们这里的空间信息的含义来源于信息检索领域的狭义定义,讨论的是与空间位置有关的信息检索问题。
空间信息检索和信息检索有很多重叠的内容,很多信息检索的算法可以直接应用到空间信息检索问题中,例如目前国内的几套商业地理编码(地址定位)软件都是基于全文检索技术开发的。但同时空间信息检索也有一些传统信息检索算法无法解决或者解决的不好的问题。空间语言描述中各个单词之间往往具有很强的相关性,这些相关性来源于这些单词所表达的实际地物之间的空间关系和拓扑关系。传统信息检索模型往往无法捕获和利用这些相关性,从而导致检索结果的错误或者低效。
空间信息检索小组在现有信息检索算法的基础上结合空间信息的特点对其进行扩展,以提高空间信息检索的准确率和召回率。中文地址和位置描述的混乱性和不规范性给我们的科研提供了现实的挑战和机遇。目前空间信息检索小组主要聚焦解决我国城市地址的高精度定位问题。
空间信息检索小组将利用和整合空间本体建模小组和神经网络小组的科研成果。

科研工具

原型系统

参考资料

例会记录


地址:北京大学遥感楼,电话/传真:010-62757994,Email:xuehu@pku.edu.cn,网站:http://www.geocoding.cn
Powered by FitNesse