presto简介、与hive比较

最近在查询hive数据做展示的时候,读取hive数据,一开始使用hive查询,但速度非常慢,偶然发现可以使用presto引擎,速度相比hive要快上许多,这里进行一下比较和整理下大概原因。

gfs分享

Google file system

问题

问题: 如何高效可靠地存储如此大规模的数据 ?

GFS是Google为其内部应用设计的分布式存储系统

问题的关键点是 高效 、 可靠、规模巨大

传统操作系统的问题在于 1. 硬盘不够大,存不了那么多 2. 数据不安全,传上去,硬盘瞬间损坏了,数据就没了

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×