一点一滴

“大数据”

大数据-分类

HIVE 时间操作函数

1.日期函数UNIX时间戳转日期函数from_unixtime语法: from_unixtime(bigint unixtime[, string format])返回值: string说明...

hive中控制map和reduce数量的简单实现方法

先说结论:  由于mapreduce中没有办法直接控制map数量,所以只能曲线救国,通过设置每个map中处理的数据量进行设置;reduce是可以直接设置的。控制map和reduce的参数set ...

Hive ORC和Parquet

Parquet与ORC对比Parquethttp://parquet.apache.orgOrchttp://orc.apache.org发展状态目前都是Apache开源的顶级项目,列式存储引擎...

hive 配置参数说明

hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) truehive.exec.mode.local.auto...

新一代大数据处理引擎 Apache Flink

大数据计算引擎的发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先...