一点一滴

Spark-Spark RDD Lazy Evaluation的特性及作用

主要为了解决3个疑问rdd的弹性表现在哪？什么是spark lazy 特性？spark lazy evaluation 的好处都有什么？rdd的弹性表现在哪RDD（Resilient Di...

2023.03.03 spark 访问: 401 次

在Spark应用开发中，很容易出现如下报错：org.apache.spark.SparkException: Task not serializable at org.apache.spar...

2023.03.03 spark 访问: 427 次

1、为什么要序列化？一般来说，"活的"对象只存在内存里，关机断电就没有了。而且"活的"对象只能由本地的进程使用，不能被发送到网络上的另外一台计算机。然...

2023.03.03 Hadoop 访问: 400 次

序列化文本TextSerializer 提供了一个便利的方式来进行序列化和反序列化 Text 实例。它有三种适用格式︰格式化与原生字符串XML 格式JSON 格式配置文件格式TextSeria...

2023.03.03 java 访问: 418 次

1.transformation操作为什么需要序列化spark是分布式执行引擎，其核心抽象是弹性分布式数据集RDD，其代表了分布在不同节点的数据。Spark的计算是在executor上分布式执行...

2023.03.03 spark 访问: 367 次