当法国总统雅克•希拉克(Jacques Chirac)在始建于18世纪、金碧辉煌的爱丽舍宫(Elysée Palace)发表新年讲话时,政治观察家们意外地发现:他谈到了搜索引擎问题。
希拉克表示:“我们需要……推出首个真正的多媒体搜索引擎Quaero,以应对Google和雅虎(Yahoo)带来的全球挑战。 ”
这一法德合作项目的拉丁语名称意为“我搜(I seek)”,之所以选择拉丁语,是为了避免触动两国在语言方面的敏感性。该项目将关注三个领域:面向普通大众,将声音、图像、视频相结合的搜索引擎;专业搜索应用软件;以及历史镜头等视听“遗产”。
欧洲恐慌
第一个目标引起了最大的关注——但其中主要是嘲弄。一位博客开玩笑说:“法国已经有了一个优秀的搜索引擎,它叫作Google.fr。”以讥讽为能事的法国报纸《鸭鸣报》(Le Canard enchaîné)也大肆嘲笑Quaero:“与微软300亿欧元的利润,以及Google 1000亿欧元的市值相比,希拉克发表的宣言肯定会引起硅谷的恐慌。”
的确,迄今为止欧洲方面一直存在着恐慌情绪。面对来自于美国和日本的挑战,法国深切地感受到了欧洲大陆对于自身在研发方面落后的担忧,这也是提出Quaero计划的原因之一。
法国政府素有在科技项目上及范围更广泛的经济领域中,实施政府干预之名,这也是实至名归,但结果喜忧参半。有两个例子甚为突出。一个是当时国有的法国电信(France Telecom) 1983年推出的Minitel,此项科技创举使用户可以搜索列车时刻表和色情内容——就像他们今天在互联网上所做的一样,并在其后的10年被互联网所取代。但该系统的成功基于为用户提供免费终端,该系统从未在法国以外的地方得到普及。
另一个例子是信息技术集团布尔公司(Bull),该公司得到了法国纳税人数十亿欧元的支持,但上世纪80年代,它最终未能实现成为法国IBM的梦想。
尽管如此,法国政府还是制订了进一步计划,以应对在其看来盎格鲁萨克逊式影响力日益增强的威胁。今年它计划推出一个国际卫星电视新闻频道:法国国际新闻频道(CFII),该频道有一项雄心勃勃的使命,即与美国有线电视新闻网(CNN) 相抗衡。然而,人们普遍怀疑,每年7000万欧元的预算能否足以令该频道获得成功。
新研发方式
Quaero将是对工业创新机构(Agency for Industrial Innovation,简称AII)所倡导的新研发方式的一个检验,该机构的创立,源自于玻璃和陶瓷集团法国圣戈班(Saint-Gobain)董事长让-路易•贝法(Jean-Louis Beffa)的想法。AII将提供法国方面资金的一半,而由法国传媒服务及设备集团汤姆逊(Thomson)牵头的一些公司则同意提供另一半资金。
德国方面的讨论还在进行之中。但政府和由贝塔斯曼(Bertelsmann)牵头的一些公司之间,可能也会达成类似的安排。
不过,这种安排并非“国有领军企业”努力的一部分,因为这些企业中还包括一些中小型软件公司、国家电视档案馆和大学。
大学和公司的合作关系
AII是建立在这样的原则之上:大学和公司之间的合作关系能够推动创新,但前提是防止公司出于自身意图,限制信息的流动。
法国方面的团队坚信,这种创新方式比人们想象的更接近美国的做法。“美国通过不同的机构(有时与军事领域相关),为公司的研发活动提供大笔资金,并取得了重要的民用成果,”贝法在就法国工业政策致希拉克总统的报告中写道。该报告为AII和Quaero奠定了基础,Quaero是AII的旗舰项目。Quaero成员辩称,毕竟互联网本身最初源自于美国在军事领域的研究。
Quaero项目财团的成员并未理会外界的批评,并且否认自己的动机是出于政治上的狂热民族主义。他们认为,自己掌握了正确技巧,并且重要的是,得到了极为庞大的公共资金投入,以取得具备商业可行性的技术进步。
“真正的多媒体”搜索引擎
如果成功的话,Quaero将成为第一个“真正的多媒体”搜索引擎。研究者们辩称,Google或许已围绕其优秀的搜索引擎创建了一项强大业务,但在音频、照片及视频的索引和搜索方面,至今仍无人赢得这场战役。
“我认为,目前Google在多媒体搜索技术方面并没有超越我们。” 法国国家科研中心(CNRS)研究员、法国大学团队的项目负责人让-吕克•戈万(Jean-Luc Gauvain)称,“不过,它们的资源显然很庞大。”
建立图片、音频和视频索引的问题在于,人们需要用文字对其归类并加以描述。但是该财团另一成员、 法国政府武器采购局(DGA)研究部门的爱德华•若弗鲁瓦(Edouard Geoffrois)表示,这会影响搜索结果的清晰度。“如果你在诸如Google图片搜索(Google Image Search)之类的搜索引擎中键入‘乔治•布什(George Bush)’几个字,你会搜到乔治•布什的照片,但也可能得到无用信息。如果有人管他的猫叫‘乔治•布什’,并将它的照片放到网上,你也会搜到这只猫的照片。”
Quaero的目标是,搜索时无须借助文字描述就能“读懂”音频、图像和视频的内容。目前,这样的图片识别程序已经存在:法国中型软件公司、Quaero 项目成员LTU Technologies向美国联邦调查局(FBI)提供电脑取证分析工具,用于分析被扣押的硬盘中的图片,并将其与已知的恋童癖罪犯的照片相比对。
还有一些可将语音转录为文字的音频解析程序。法国国家科研中心面临的挑战是,如何改进这些工具以提高搜索准确度,并让搜索引擎查阅这些转录内容,而非简单地浏览文件名。
随着播客(podcast)的日益流行,这项技术将愈发重要。可下载的音频文件从去年开始大幅增加,但文件量的激增意味着分清良莠的难度不断上升。戈万称:“我们有能力储存一切,问题在于我们无法组织它们并建立索引。手工操作将花费数百万小时,这终归不可行。”如果网上所有的音频内容都能被自动转录,那么这一过程将变得很简单。
尽管建立多媒体内容索引是该程序的根本所在,但Quaero并不仅仅是一个互联网搜索引擎。汤姆逊公司有意在其生产的机顶盒中,提供内置搜索工具,并为其电视电影公司的客户提供可供搜索的内容。贝塔斯曼希望在各种平台上创造类似的多媒体搜索工具。Quaero的第三个使用方向是为法国国家视听研究所(French National Audiovisual Institute)和German Studio Hamburg的大量电影胶片档案资料建立索引。
目前互联网不能胜任
目前能从互联网上获取的各类工具并不能胜任这一任务。 美国在线(AOL)于2004年收购了视听搜索引擎Singing Fish,但其搜索效果一般。
上周,利用Singing Fish搜索“阿里埃勒•沙龙(Ariel Sharon)”,仅出现358个结果,位列头条的是一张沙龙微笑的照片,旁边是一行与目前事态不符的标题——《以色列总理阿里埃勒•沙龙现已从耶路撒冷一家医院出院 渴望重返工作》。这位以色列总理目前生命垂危,而这则视频资料所标注的日期是12月份。
不管硅谷是否会受到Quaero的冲击,它都将饶有兴趣地关注此事。 (责任编辑:关美纳) |