Dragonfly:全世界最快的内存数据库

Dragonfly:全世界最快的内存数据库

技术教程gslnedu2024-12-29 0:42:319A+A-

全世界最快的内存数据库

Dragonfly是一种针对现代应用程序负荷需求而构建的内存数据库,完全兼容Redis和Memcached的 API,迁移时无需修改任何代码。相比于这些传统的内存数据库,Dragonfly提供了其25倍的吞吐量,高缓存命中率和低尾延迟,同时Dragonfly还能轻松进行垂直扩展。

Dragonfly 是一种现代内存数据存储,与 Redis 和 Memcached API 完全兼容。Dragonfly 在多线程、无共享架构之上实现了新颖的算法和数据结构。与 Redis 相比,Dragonfly 的性能提升了 25 倍,并支持单实例数百万 QPS。

Dragonfly 与 Redis 生态系统完全兼容,无需更改代码即可实现。


目录

  • 基准测试
  • 快速入门
  • 配置方法
  • 开发路线和开发现状
  • 设计决策

基准测试

Dragonfly在c6gn.16xlarge上达到了每秒380万个查询(QPS),相比于Redis,吞吐量提高了25倍。

在Dragonfly的峰值吞吐量下,P99延迟如下:

op

r6g

c6gn

c7g

set

0.8ms

1ms

1ms

get

0.9ms

0.9ms

0.8ms

setex

0.9ms

1.1ms

1.3ms

所有基准测试均使用memtier_benchmark(见下文),根据服务器类型和实例类型调整线程数。memtier运行在独立的c6gn.16xlarge机器上。对于setex基准测试,我们使用了500的到期范围,以便其能够存活直到测试结束。

  memtier_benchmark --ratio ... -t <threads> -c 30 -n 200000 --distinct-client-seed -d 256 \
     --expiry-range=...

当以管道模式运行,并设置参数--pipeline=30时,Dragonfly可以实现10M qps的SET操作和 15M qps的GET操作。

Memcached / Dragonfly

我们在 AWS 的 c6gn.16xlarge 实例上比较了 memcached 和 Dragonfly。如下图所示,与 memcached 相比,Dragonfly 的吞吐量在读写两方面上都占据了优势,并且在延迟方面也还不错。对于写入工作,Dragonfly 的延迟更低,这是由于在 memcached 的写入路径上存在竞争(请参见此处)。

SET benchmark

Server

QPS(thousands qps)

latency 99%

99.9%

Dragonfly

3844

0.9ms

2.4ms

Memcached

806

1.6ms

3.2ms

GET benchmark

Server

QPS(thousands qps)

latency 99%

99.9%

Dragonfly

3717

1ms

2.4ms

Memcached

2100

0.34ms

0.6ms

对于读取基准测试,Memcached 表现出了更低的延迟,但在吞吐量方面比不上Dragonfly。

内存效率

在接下来的测试中,我们使用 debug populate 5000000 key 1024 命令向 Dragonfly 和 Redis 分别写入了约 5GB 的数据。然后我们使用 memtier 发送更新流量并使用 "bgsave" 命令启动快照。下图清楚地展示了这两个服务器在内存效率方面的表现。

在空闲状态下,Dragonfly 比 Redis 节省约 30% 的内存。 在快照阶段,Dragonfly 也没有显示出任何明显的内存增加。 但同时,Redis 在峰值时的内存几乎达到了 Dragonfly 的 3 倍。 Dragonfly 完成快照也很快,仅在启动后几秒钟内就完成了。 有关 Dragonfly 内存效率的更多信息,请参见 dashtable 文档。

配置方法

Dragonfly 支持 Redis 的常见参数。 例如,您可以运行:dragonfly --requirepass=foo --bind localhost。

目前,Dragonfly 支持以下 Redis 特定参数:

  • port:Redis 连接端口,默认为 6379。
  • bind:使用本地主机名仅允许本地连接,使用公共 IP 地址允许外部连接到该 IP 地址
  • requirepass:AUTH 认证密码,默认为空 ""。
  • maxmemory:限制数据库使用的最大内存(以字节为单位)。0 表示程序将自动确定其最大内存使用量。默认为 0。
  • dir:默认情况下,dragonfly docker 使用 /data 文件夹进行快照。CLI 使用的是 ""。你可以使用 -v docker 选项将其映射到主机文件夹。
  • dbfilename:保存/加载数据库的文件名。默认为 dump;

此外,还有 Dragonfly 特定的参数选项:

  • memcached_port:在此端口上启用 memcached 兼容的 API。默认禁用。
  • keys_output_limit:在keys 命令中返回的最大键数。默认为 8192。
  • keys 命令是危险命令。我们会截断结果以避免在获取太多键时内存溢出。
  • dbnum:select 支持的最大数据库数。
  • cache_mode:请参见下面的 缓存 部分。
  • hz:键到期评估频率。默认为 100。空闲时,使用较低的频率可以占用较少的 CPU资源,但这会导致清理过期键的速度下降。
  • snapshot_cron:定时自动备份快照的 cron 表达式,使用标准的、精确到分钟的 cron 语法。默认为空 ""。
  • 下面是一些 cron 表达式的示例,更多关于此参数的细节请参见文档。
  • Cron 表达式描述* * * * *每分钟*/5 * * * *每隔 5 分钟 (00:00, 00:05, 00:10...)5 */2 * * *每隔 2 小时的第 5 分钟0 0 * * *每天的 00:00 午夜0 6 * * 1-5从星期一到星期五的每天 06:00 黎明
  • save_schedule:以 UTC 时间规范保存快照,格式: HH:MM(24 小时制时间)。默认为空 ""。该参数被标记为弃用,新版本中推荐使用 snapshot_cron 参数替代。
  • primary_port_http_enabled:如果为 true,则允许在主 TCP 端口上访问 HTTP 控制台。默认为 true。
  • admin_port:如果设置,将在指定的端口上启用对控制台的管理访问。支持 HTTP 和 RESP 协议。默认禁用。
  • admin_bind:如果设置,将管理控制台 TCP 连接绑定到给定地址。支持 HTTP 和 RESP 协议。默认为 any。
  • admin_nopass: 如果设置,允许在不提供任何认证令牌的情况下,通过指定的端口访问管理控制台。同时支持 HTTP 和 RESP 协议。 默认为 false。
  • cluster_mode:支持集群模式。目前仅支持 emulated。默认为空 ""。
  • cluster_announce_ip:集群模式下向客户端公开的 IP。

启动脚本示例,包含常用选项:

./dragonfly-x86_64 --logtostderr --requirepass=youshallnotpass --cache_mode=true -dbnum 1 --bind localhost --port 6379  --save_schedule "*:30" --maxmemory=12gb --keys_output_limit=12288 --dbfilename dump.rdb

要获取更多选项,如日志管理或TLS支持,请运行 dragonfly --help。

设计决策

全新的缓存设计

Dragonfly采用单一的自适应缓存算法,该算法非常简单且具备高内存效率。 你可以通过使用 --cache_mode=true 参数来启用缓存模式。一旦启用了此模式,Dragonfly将会删除最低概率可能被使用的内容,但这只会在接近最大内存限制时发生。

相对准确的过期期限

过期范围限制最高为约4年。此外,对于大于134217727ms(大约37小时)的到期期限,毫秒精度级别(PEXPIRE/PSETEX等)会被简化到秒级。 这种舍入的误差小于0.001%,我希望这在长时间范围情况下是可以接受的。 如果这不符合你的使用需求,请与我联系或提出一个Issue,并解释您的情况。

关于与Redis实现之间的更多差异,请参见此处。

原生HTTP控制台和兼容Prometheus的标准

默认情况下,Dragonfly允许通过其主TCP端口(6379)进行HTTP访问。没错,您可以通过Redis协议或HTTP协议连接到Dragonfly - 服务器会在连接初始化期间自动识别协议。 不妨在你自己的浏览器中尝试一下。现在HTTP访问没有太多信息可供参考,但在将来,我们计划添加有用的调试和管理信息。如果您转到: 6379/metrics URL,您将看到一些兼容Prometheus的标准。

Prometheus导出的标准与Grafana仪表盘兼容,请参见此处。

重要!HTTP控制台仅应在安全网络内访问。如果您将Dragonfly的TCP端口暴露在外部,则建议使用--http_admin_console=false或--nohttp_admin_console禁用控制台。

安装

Docker 安装

如果您的计算机上没有 docker,请先安装 Docker ,然后再继续。

先决条件

  • 至少 4GB RAM 才能获得 Dragonfly 的优势
  • 至少 1 个 CPU 核心
  • Linux 内核 4.19 或更高版本
docker run --network=host --ulimit memlock=-1 docker.dragonflydb.io/dragonflydb/dragonfly

docker compose 安装

wget https://raw.githubusercontent.com/dragonflydb/dragonfly/main/contrib/docker/docker-compose.yml
# Launch the Dragonfly Instance
docker compose up -d
# Confirm image is up
docker ps | grep dragonfly
# ac94b5ba30a0 docker.dragonflydb.io/dragonflydb/dragonfly "entrypoint.sh drago…" 45 seconds ago Up 31 seconds 0.0.0.0:6379->6379/tcp, :::6379->6379/tcp docker_dragonfly_1
# Log follow the dragonfly container
docker logs -f docker_dragonfly_1

使用

与redis客户端连接

redis-cli
127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> keys *
1) "hello"
127.0.0.1:6379> get hello
"world"
127.0.0.1:6379>

项目地址:https://raw.githubusercontent.com/dragonflydb

点击这里复制本文地址 以上内容由朽木教程网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

朽木教程网 © All Rights Reserved.  蜀ICP备2024111239号-8