Information Desk是关于企业内部网搜索的一个研究原型系统,它由微软亚洲研究院和微软SharePoint Search组共同开发,现在试运行在微软公司内部网MSWeb上。Information Desk能自动从网站中的文件中抽取领域信息和文件元数据。领域信息包括定义、缩写和主页,文件元数据则包括标题、作者以及关键词,而适用的文件格式包括Word 、PowerPoint、HTML。Information Desk能有效利用抽取的信息帮助SharePoint用户搜索企业内部网信息, 从而为用户提供更好的服务。 比如:“Information Desk能解答诸如“这个术语是什么意思?”,“这个产品组主页在哪?”,以及“谁了解这项技术?”之类的问题。目前以MSWeb作实验,已经索引了6,000,000以上的文件。这些技术以统计学习技术为基础,从而能够比较容易地应用到其它领域。(责任编辑:韩建光) |