Skip to main content

26 docs tagged with "2023-01"

View All Tags

LSM日志结构合并树

不会为每个关键字创建索引记录,而是为数据记录未见的每个存储块设一个键-指针对,存储块意味着块内存储单元连续。

业务数据埋点

什么是业务数据埋点?常见的埋点方式有哪些?代码埋点、可视化埋点、全埋点

什么是ETL

什么是ETL?抽取(extract)、转换(transform)、加载(load)

数仓中的度量、维度、事实表

度量值、维度表、事实表。可统计次数、个数、金额等。比如订单表中的下单金额。 对事实的描述信息,每一张维表对应现实世界中的一个对象或概念

数仓仓库常见的分层结构

原始数据层,汇集多个原始未处理的数据,比如埋点日志,业务数据库、队列等,是后续数据仓库加工数据的来源。

数据库里的列存储

一般适合读多写少的场景,适合OLAP分析型系统,列存储在聚合、统计等操作性能会优于行存储,同个数据类型会进行数据压缩更省空间。

数据库里的行存储

传统的OLTP关系型数据库都是行存储,比如Oracle、Mysql一行中的数据在存储介质中以连续存储形式存在。