2018-03-29

hadoop

2 分钟读完 (大约 309 个字)

presto简介、与hive比较

最近在查询hive数据做展示的时候，读取hive数据，一开始使用hive查询，但速度非常慢，偶然发现可以使用presto引擎，速度相比hive要快上许多，这里进行一下比较和整理下大概原因。

一、简介#

presto简介

二、与hive比较#

hive_presto

hive查询需要把数据先map，按照查询条件为key，取的字段为value，得到一条条数据，然后按key分类持久化到磁盘，然后再从磁盘读出来进行 count,sum，distinct等reduce操作，每一次map reduce都要写读磁盘.

而且将 sql分为多个语句，分的有先后顺序，需要等前面的算完了，再进行下一步

presto的话，是纯内存的，不是mapreduce，但也是分解sql为多个任务，但是是并发进行，最后再串联，全程都是内存操作，所以很快。

实际执行效果如下图所示:

presto执行运转

# hadoop

大菜猫

做点有用的

beijing

文章

92

分类

27

标签

36

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now