一点一滴
点点滴滴,记录人生如何在hive中查出的所有字段包裹整json对象
您可以使用Hive中的内置函数to_json()将查询结果包装成一个完整的JSON对象。例如,以下查询将返回一个包含所有字段的JSON对象:SELECT to_json(struct(*)) A...
如何基于湖仓一体构建轻量级的文本索引?
背景日志/埋点/业务数据库是互联网公司大数据分析处理的的几种主要数据来源,其中日志数据主要用于业务数据分析/监控告警/生产排障等重要场景,日志数据的特点是Schema较弱,包含大量文本数据,如何...
通过数据组织加速大规模数据分析
背景交互式分析是大数据分析的一个重要方向,基于TB甚至PB量级的数据数据为用户提供秒级甚至亚秒级的交互式分析体验,能够大大提升数据分析人员的工作效率和使用体验。限于机器的物理资源限制,对于超大规...
从Photon论文谈大数据计算引擎的Native化
Databricks在ACM Sigmod2022发表了关于Photon的论文,关注大数据或者Apache Spark的同学可能都对于Photon有所耳闻,它是Databricks的闭源商业化版...
MinDoc 简介
http://www.manongjc.com/detail/56-wygliknaielvrlj.html