聚合计算存储体系结构的主要吸引力在于,通过使计算引擎接近其所需数据,可以提高性能。然而,维护这样一个紧密结合的体系结构的成本正在逐渐超过其性能优势。特别是随着云资源的普及,能够独立地伸缩计算和存储意味着巨大的成本节约和更低的维护成本。这种体系结构的逆转使许多数据平台处于艰难的境地,被迫在性能和成本间进行权衡。Alluxio通过在分离的体系结构中提供相同于聚合计算存储体系结构的性能来解决这个难题。

Alluxio与计算节点部署在一起,其提供接近客户机缓存来实现上述的性能。应用程序和计算框架通过Alluxio发送请求,而Alluxio又从远程存储中获取数据。同时,Alluxio在其存储中维护数据的缓存副本,无论是在内存中还是在Alluxio节点上可用的持久化介质中。以后的请求可以自动的读取被缓存的数据。这提供了与聚合体系结构相仿的性能。然而,关键的区别在于,Alluxio不需要保存所有数据;它只需要保存工作集。因此,Alluxio不需要大量的存储,且可以在有限的存储大小上运行,不管数据的总大小是多少。当工作集足够大时,Alluxio将根据可用的存储量提供增量收益。
缓存工作集本身并不是改变游戏规则的创新。但是,加上Alluxio统一名称空间的灵活性,这两个特性一起使得Alluxio系统可以方便地用于数据访问。
网友评论