“大数据”
大数据-分类巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践
https://www.jufair.com/information/55881.htmlhttps://xie.infoq.cn/article/8be6edf15d7ea5aa2dd9805...
10分钟带你全面了解StarRocks!
StarRocks 是一款极速全场景 MPP 企业级数据库产品,具备水平在线扩缩容,金融级高可用,兼容 MySQL 5.7 协议和 MySQL 生态,提供全面向量化引擎与多种数据源联邦查询等重要...
如何在hive中查出的所有字段包裹整json对象
您可以使用Hive中的内置函数to_json()将查询结果包装成一个完整的JSON对象。例如,以下查询将返回一个包含所有字段的JSON对象:SELECT to_json(struct(*)) A...
如何基于湖仓一体构建轻量级的文本索引?
背景日志/埋点/业务数据库是互联网公司大数据分析处理的的几种主要数据来源,其中日志数据主要用于业务数据分析/监控告警/生产排障等重要场景,日志数据的特点是Schema较弱,包含大量文本数据,如何...
通过数据组织加速大规模数据分析
背景交互式分析是大数据分析的一个重要方向,基于TB甚至PB量级的数据数据为用户提供秒级甚至亚秒级的交互式分析体验,能够大大提升数据分析人员的工作效率和使用体验。限于机器的物理资源限制,对于超大规...