一点一滴

一点一滴

点点滴滴,记录人生

Spark读取多个文件为一个RDD

读取多个文件为一个RDD读取多个文件为RDD时,我们可以使用textFile()或者wholeTextFiles函数,这两个函数之间的主要的区别在于:返回内容的不同,wholeTextFiles...

全面解读数据湖与数据仓库的区别

大数据时代,数据存储对任何机构来说都是一件头等大事。从数据仓库(Data Warehouse),到如今如火如荼的数据湖(Data Lake),都被机构广泛应用于大数据存储,但从结构和处理方式上都...

详解数据湖,概念、特征、架构、方案、场景以及建湖全过程

https://blog.csdn.net/huzechen/article/details/123143902导读:最近,数据湖的概念非常热,许多前线的同学都在讨论数据湖应该怎么建?有没有成熟...

焱融看|非结构化数据场景下,数据湖到底有多香?

当前,云计算、人工智能、物联网等技术在各行各业更加广泛地普及与应用,前沿技术在给社会创造价值以外,也在产生着大量的数据,导致数据的管理和价值挖掘变得愈加复杂和困难。这主要是因为,一方面,数据在不...

什么是湖仓一体?

https://zhuanlan.zhihu.com/p/298428529湖仓一体是一种开放式数据管理架构,集数据湖的灵活性和可扩展性优势以及数据仓库的数据结构和数据管理功能于一体。数据仓库在...