富士通研究所(总部位于川崎市)2004年3月31日宣布,日前开发成功了使用XML(可扩展标记语言)描述数据的新型处理技术。由于只需较少的内存和较低的CPU负荷即可处理大批的XML数据,因此,可用来提高企业XML数据处理速度以及在移动设备上使用XML等,这样大大扩展了该技术的应用领域。
采用新技术,只需此前1/10的内存即可处理同样的XML数据。此前读写数据时,需要将所有XML数据在主内存上展开后使用。由于展开后的存储空间相当于源数据的4~6倍,因此需要考虑主机内存大小等问题。而采用新技术的话,能够有效地在内存中打开XML数据,大大减少了内存占用量。
新技术包含(1)XML数据的局部展开技术和(2)XML数据的压缩技术——两部分。采用局部展开技术时,只需在内存上展开需要的数据部分即可。该技术是出于这样的考虑——大多数情况下不需要对所有的数据进行处理。采用该技术,处理数据时需要的内存容量约相当于此前的1/4,同时还大大减轻了主机负荷。另一方面,压缩技术的原理是:在内存上展开XML数据时占用的内存容量几乎与数据中包含的要素数成比例。通过将不属于数据处理对象的要素以CSV形式组合为一个整体,大大减少了要素部分所占用的内存量。
将此次开发的技术应用于70MB的XML数据(图书目录,含1万8543件记录)后,证实了使用该技术可以以28MB的内存使用量处理该数据。这一内存容量约为此前的1/10。随着占用内存的减少,内存管理所需要的处理也相应减少,主机负荷也随之减轻。富士通研究所今后将致力于强化软件功能,尽快推出相应产品。 |