一点一滴

一点一滴

点点滴滴,记录人生

数据治理:数据质量的度量维度

关于数据质量的度量维度,业内还没有一个统一的标准,以下分享几个常见的数据质量度量维度。1、记录数完整记录数:正在评估数据集的记录数值。检查记录数量是否与预期数量相负。如果不符,调查却是记录的根本...

大数据开发之路-离线数仓

https://winway.github.io/2022/05/24/bigdata-stack-dw/离线数仓-大数据系统的重量级应用数据仓库概念诞生于1990年,由Inmon提出。截至今天...

字节跳动一站式数据治理解决方案及平台架构

“一站式数据治理解决方案及平台架构”的分享会分为四个部分展开:首先,明确数据治理的概念,从平台视角出发,介绍在字节跳动内部数据治理所服务的目标其次,介绍字节跳动内部数据治理的现状与我们需要解决的...

汇总,大数据开源框架技术扫盲

目录系统平台 (Hadoop、CDH、HDP)监控管理 (CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle)文件系统 (HDFS、GPFS、Ceph、...

大数据相关开源项目及组件汇总

URL:https://www.codetd.com/article/11598609前言花了一点时间,整理了大数据相关开源项目、组件和官网地址。按照实际应用功能的不同,分为以下10个部分,并在...