搜索结果聚类技术由微软亚洲研究院网络搜索与挖掘组开发。它对搜索引擎的查询结果在线进行分组,并为这些分组选取合适的命名。该技术把传统的搜索结果表达方式变得更加易于浏览。常规的聚类算法并不适合这个应用,因为搜索引擎反馈回的摘要比较短小,而且一般的聚类算法运算复杂度较高难以实现实时计算。我们开发的技术从另一方面解决了这个问题。我们的基本做法是首先找到典型的独立主题,然后再把已有的搜索结果按照一定规则分配到这些主题之下,从而实现层次化的浏览界面。
(责任编辑:韩建光)