一点一滴

“大数据”

大数据-分类

10分钟带你全面了解StarRocks!

StarRocks 是一款极速全场景 MPP 企业级数据库产品,具备水平在线扩缩容,金融级高可用,兼容 MySQL 5.7 协议和 MySQL 生态,提供全面向量化引擎与多种数据源联邦查询等重要...

如何在hive中查出的所有字段包裹整json对象

您可以使用Hive中的内置函数to_json()将查询结果包装成一个完整的JSON对象。例如,以下查询将返回一个包含所有字段的JSON对象:SELECT to_json(struct(*)) A...

如何基于湖仓一体构建轻量级的文本索引?

背景日志/埋点/业务数据库是互联网公司大数据分析处理的的几种主要数据来源,其中日志数据主要用于业务数据分析/监控告警/生产排障等重要场景,日志数据的特点是Schema较弱,包含大量文本数据,如何...

通过数据组织加速大规模数据分析

背景交互式分析是大数据分析的一个重要方向,基于TB甚至PB量级的数据数据为用户提供秒级甚至亚秒级的交互式分析体验,能够大大提升数据分析人员的工作效率和使用体验。限于机器的物理资源限制,对于超大规...

从Photon论文谈大数据计算引擎的Native化

Databricks在ACM Sigmod2022发表了关于Photon的论文,关注大数据或者Apache Spark的同学可能都对于Photon有所耳闻,它是Databricks的闭源商业化版...