Vite存储层设计详解之blockDB文件系统设计

首页 > 技术 > Vite存储层设计详解之blockDB文件系统设计

ViteLabs 2020-11-27

Vite存储层设计详解之blockDB文件系统设计

摘要：blockDB用来存储交易(Transaction/AccountBlock)、快照(SnapshotBlock)数据，这两种数据类型在一个快照生成时都是一个最

blockDB用来存储交易(Transaction/AccountBlock)、快照(SnapshotBlock)数据，这两种数据类型在一个快照生成时都是一个最终确认的状态，写入后无需修改，因此非常适合通过快速追加写入的方式进行高效率的存储。blockDB的存储就是按照追加写入优化的思路进行设计的，通过ringBuffer将需要顺序写入的数据依次写入一个队列，然后异步地批量写入文件。

1.写入数据的提交

一个SnapshotBlock和关联的AccountBlock列表会作为一个整体提交到存储层进行存储，存储层依次遍历AccountBlock和他们关联的SnapshotBlock，对相关数据结构进行序列化，然后写入存储。

2.ringBuffer

序列化后的数据并不会直接写入文件，而是写入一个称为ringBuffer的内存缓冲区，这个缓冲区由连续的10M的子数据段(Segment)构成，每个数据段有对应的递增序列号fileId。对于每个Block，首先会写入该Block序列化后的字节长度值，后面才是真正的数据内容。因为Block和段不是一一对应，就会存在一个Block的数据需要跨段的问题，为了能够定位和存储一个Block数据段，通过[fileId, offset]二元组定位一个Block的起始位置，其中offset为该Block在该段中的offset。

为了便于提高效率，减少开辟和回收缓存区的开销，这里会将这些连续段拼接成一个称为ringBuffer的虚拟环，新数据追加到环的末尾(Tail)，旧数据从队头(Head)弹出，追加和弹出的操作都是通过移动段下标的方式来完成的，队头和队尾之间的为待flush的已使用段，其他部分的段为可以被覆盖的空闲段。

已使用段的数据被用作写缓存，同时也可以做读缓存，空闲段的数据如果之前曾经写入过有效数据，则也会被当做读缓存，因此整个ringBuffer都可以被用来做读缓存。整个ringBuffer相当于是一个最近写入数据的read-write buffer。

在短期写入ring buffer的数据超过flush速度时，会导致数据超过ring buffer现有容量，ring buffer会自动扩容，待数据逐步写入文件列表后，ring buffer会自动收缩到初始容量。

3.文件列表、随机读取及账本同步

blockDB使用文件大小固定的小文件列表来存储block数据，每个文件对应上面ringBuffer中的一个段，文件名既是前面ringBuffer中的标记fileId。通过定期的flush操作，ringBuffer中的已使用段会被依次写入文件系统，已flush的段会成为空闲段。

随机读取一个block操作首先会通过blockDB索引获取[fileId, offset]二元组，然后根据fileId尝试在ringBuffer中定位段，如果失败，在通过fileId打开对应的小文件，并seek到offset位置，从该位置的开头读取数据大小后，就可以连续读取该Block对应的数据块，这时候可能会涉及到要跨文件读取fileId+1的下一个小文件。因为采用了小文件来存储，seek操作相比大文件来说会快很多，并且对于系统的页缓存也比较友好。

小文件列表在顺序写入和批量顺序读取上有很好的性能，这个特性在"账本同步"的场景中非常有用。

4.数据回滚

blockDB只支持将数据从最新状态删到某个历史状态，不允许删除中间一段历史数据，即数据是一个连续片段，不允许有数据空洞。

回滚数据分为预删除和删除两个阶段。在预删除阶段，先在ring buffer中删除对应数据，然后标记需要删除到的目标位置，标记完后这段数据已不可读，但并未被真正删除。在下次"异步批量Flush"时，开启删除阶段，这时会真正删除文件列表中的数据。

5.数据压缩

目前使用snappy算法做数据压缩，对每个block进行压缩。

Tags:

Vite 存储设计详解 blockDB 文件系统 bl

免责声明: 世链财经作为开放的信息发布平台，所有资讯仅代表作者个人观点，与世链财经无关。如文章、图片、音频或视频出现侵权、违规及其他不当言论，请提供相关材料，发送到：2785592653@qq.com。; 风险提示：本站所提供的资讯不代表任何投资暗示。投资有风险，入市须谨慎。; 世链粉丝群：提供最新热点新闻，空投糖果、红包等福利，微信：juu3644。

快讯

2025年12月25日星期四

Vite存储层设计详解之blockDB文件系统设计

快讯

GBF投资的知名预测项目Pton近期大动作频繁

BTCFI 项目将携手预测事件市场 PTON 项目，共同推出全新预测市场产品

2025亚洲Web3嘉年华暨CocoCat慈善晚宴将于12月香港揭幕

币多多（S-Cointool）——Web3 链上科技信息服务平台

Gate Alpha开启限时0手续费活动

HTX DeepThink：链上资金逐步转向高Beta资产，山寨季或将到来

开通官方身份验证通道以打击冒充员工欺诈行为

视频

币圈大佬遭遇枪口打劫！ZachXBT警告：炫富要谨慎，见面需当心

姨太链上活动激增，Gas费暴涨近5倍!

CZ回归江湖！新计划曝光：教育、投资、慈善样样来