大数据开发核心技术 - 大数据仓库Hive精讲
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行
运行。其优点是学习成本低,可以通类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
一、Hive 初识入门 1)Hive功能、体系结构、使用场景 | 二、Hive深入使用 1)Hive中的内部表、外部表、分区表 |
三、Hive高级进阶 1)Hive数据的存储和压缩 | 四、实际案例分析 1)依据业务设计表 |