惠普CEO马克·赫德和CIO兰迪·莫特打算利用过去的经验,和IBM、甲骨文以及NCR一较高下。
一些大型公司和久经世故的数据集成商采用数据仓库已经达十多年之久,然而成功掌握数据仓库者却寥寥无几。
不过,惠普公司(HP)认为数据仓库可以帮助企业(不仅仅是大公司和那些久经世故的集成商)做得更好。在过去的几个月,惠普凭借一个名叫“Neoview”系统的产品挤进了数据仓库市场。这个系统诞生于惠普的研究实验室,并在惠普公司内部进行首次应用。
在最近接受《InformationWeek》的采访之前,惠普对于此项计划一直保持沉默,即使从通常非常健谈的惠普市场部人员口中也只能隐约打探到一点点消息。事实上,惠普进入一个由国际商业机器公司(IBM)、甲骨文公司(Oracle)、赛仕软件研究所有限公司(SAS Institute Inc.,下称赛仕软件研究所)以及数据仓库软件提供商NCR 公司Teradata数据仓库事业部门占据的市场领域并没有足够的底气。这4家公司在数据仓库市场都拥有多年的经验,备受推崇的产品以及忠实的用户,再加上依靠SQL服务器数据库强行切入市场的微软公司(Microsoft),他们几家在年收入52亿美元的数据仓库软件市场占据85%的份额。据预测,到2010年,互联网数据中心(IDC)项目支出将以每年9.5%的速度递增,数据仓库是IDC项目的一部分。
惠普打破这个已经建立的市场格局的机会看起来非常小,但是他们也拥有两个非常有利的优势,那就是两位在数据仓库领域非常著名的人物:首席执行官(CEO)马克·赫德(Mark Hurd)和首席信息官(CIO)兰迪·莫特(Randy Mott)。赫德在2005年3月加入惠普之前,是NCR公司和它的Teradata部门的负责人,这使得他有机会深入了解这个充斥着数据抽取、运算法则以及数据库表格关联的神秘世界。而莫特则是美国最引人注目的数据仓库的支持者和使用者。上个世纪90年代,他在沃尔玛集团(Wal-Mart,下称沃尔玛)担任CIO期间曾建立并管理了基于Teradata数据仓库的巨大系统。加入惠普之前,他还担任了戴尔公司(Dell)的CIO。
Teradata看起来似乎最容易受到惠普此举的影响。在Teradata公司外部人中,没有人比赫德和莫特更了解Teradata的产品以及战略。而两个人在拜访客户时不断谈及“Neoview”系统,这些客户也包括Teradata的用户。
吃自己做的狗食
很多软件企业在推出新软件之前,会把新软件交给CIO,在公司内部测试性部署,这一测试方法被戏称为“吃自己做的狗食”。证明Neoview的最好场所将是惠普自己的数据中心。去年5月,就在莫特2005年7月加入惠普后不久,作为公司的3年期IT改革的一部分,惠普的IT部门废除了一个企业数据仓库。这项改革还将减少惠普内部应用系统的数量,从目前的5,000个减少到1,500个,并把目前的85个数据中心减少到6个。
惠普新的数据仓库建设必须与这个涉及面更广的项目步调一致。
它已经有180TB的原始数据和75TB的可用数据。到2008年为止,这个数据的规模至少会翻一倍。到那时,惠普全球员工总数的三分之一——大约5万名员工将可以访问这个新的数据仓库。莫特表示,最终,惠普的供应商、分销商和商业客户也将可以访问这个数据库。莫特对于这个最终期限和责任会坚守承诺,他现在负责惠普3年期IT改革和与之不可分割的数据仓库建设,它们将像当年艾森豪威尔将军指挥的“诺曼底登陆”一样载入史册。
莫特和他的团队并没有选择风险较小的路径——采用现成的技术。惠普宁可在它自己购并的产品——Tandem的NonStop操作系统和数据库上下赌注,也不愿意采用赫德和莫特如此熟悉的Teradata平台。
Tandem计算机公司(下称Tandem公司)在上个世纪80年代和90年代曾围绕NonStop系统建立了数十亿美元的生意,直到1997年被康柏计算机公司(Compaq,下称康柏)购并。2002年,康柏计算机公司又被惠普购并。NonStop在事务处理方面有着良好的声誉,不过它作为商业智能环境下的“大脑皮层组织”的能力并没有得到证实。而商业智能环境的资料分类和大型表格的关联要求不同的特征装置。
惠普的工程师在赫德和莫特到来之前,曾经对NonStop软件进行比较随意的修补,直到莫特的团队认可了这个软件的价值,惠普才决定将它进一步打造成一个商业产品。莫特说:“我们对他们整个产品路线规划有着非常大的影响。”(注:莫特是《InformationWeek》编辑顾问团的成员,对此文章不负担任何责任。)
按照设计,Neoview将成为数据仓库工具(类似Netezza和其他公司卖的产品),然后将被进一步改造成高端系统。尽管这个战略还没有得到正式宣布,惠普的新战略目前也还只是在坊间流传,但惠普网站上有已经几个网页对产品线作了描述。据了解,这个产品线包括NonStop OS微核和数据库、惠普Integrity服务器和StorageWorks存储系统,一个控制系统性能的控制面板,以及从一线业务数据库中抽取数据并将其下载到数据仓库中的能力。
可以看到,建立一个大型数据仓库所需要的大部分组件基本上都包含在内了,除了一件重要的东西——用于数据分析的工具,可谓万事具备,只欠东风。对此,惠普将和商业智能(BI)专业公司合作,包括博奥杰公司(Business Objects)、Cognos公司(Cognos)、海波龙公司(Hyperrion)、Informatica公司(Informatica)、MicroStrategy公司(MicroStrategy)和赛仕软件研究所。惠普对基于Java的BI报告工具进行了定制化开发,并在其内部做了首次展示。但他们并没有计划将此工具商业化。这部分市场被证实很难有所突破,IDC限制了数据仓库工具业务每年的市场规模就在96亿美元左右,这已经大于数据库的市场规模了。
惠普目前开始大量招聘人员来扩建Neoview开发队伍。首席架构师格雷格·贝特(Greg Battas)表示,他的团队已经扩展了一倍,现在已经有超过100名数据库专家和其他软件开发人员。他们的主要工作是参与编写数据库编译软件,该软件的功能是在数据挖掘中经常出现的复杂的表格关联中起作用。他们还把系统改造成可以处理并行工作任务,比如在扫描数据库表格进行分析的同时处理新的数据。
现在的主要任务是为Neoview创造经过改进的管理和控制工具,以及保证系统对每天的业务运营提供精确的分析。这就是惠普朴素的战略路线图。到目前为止,惠普并不希望超越它原来的计划。贝特表示:“我们非常清楚,在这个市场我们只有一次出击的机会。”
中国惠普公司也将参与到开发活动的各个方面,位于北京的惠普实验室将发挥重要的作用,据惠普实验室的研究主管刘伟透露:6个惠普中国实验室的研究人员正与他们的美国同事通力合作。他们也和中国顶级大学的计算机科学家一起编写用于迁移海量数据的软件,其中的运算规则可以在处理器中更加平均地分配计算任务。
[1] [2] [3] [下一页] |
|