指标版本 2
MinIO 使用 Prometheus 数据模型发布集群和节点指标。您可以使用任何抓取工具从 MinIO 中提取指标数据以进行进一步分析和告警。
版本 2 端点
指标版本 2 提供的指标分为三类
每个 v2 端点都会返回其类别的所有指标。例如,抓取以下端点会返回所有集群指标
http://HOSTNAME:PORT/minio/v2/metrics/cluster
仅基础端点 /minio/v2/metrics/ 返回集群指标。
- 为了更灵活地抓取和获取更广泛的指标,请使用指标版本 3。
现有部署可以继续使用版本 2 的指标和Grafana 仪表盘。
MinIO Grafana 仪表盘
MinIO 发布了两个Grafana 仪表盘,用于可视化 v2 指标。有关为 Grafana 配置 Prometheus 兼容数据源的更完整文档,请参阅 Prometheus 关于 Grafana 支持的文档。
可用的版本 2 指标
以下部分描述了版本 2 的端点和指标。
您可以使用以下 URL 端点抓取集群级指标
http://HOSTNAME:PORT/minio/v2/metrics/cluster
将 HOSTNAME:PORT 替换为 MinIO 部署的FQDN和端口。对于使用负载均衡器管理 MinIO 节点之间连接的部署,请指定负载均衡器的地址。
版本 MinIO 中已更改: RELEASE.2023-07-21T21-12-44Z
存储桶指标已移至其自己独立的端点。
版本 RELEASE.2023-08-31T15-31-16Z 中已更改: 您可以使用以下 URL 端点抓取存储桶级指标
版本 RELEASE.2025-03-12T17-29-24Z 中已更改: 出于性能原因,v2 指标有 100 个存储桶的限制。对于更多存储桶的指标,请改用v3 指标。
http://HOSTNAME:PORT/minio/v2/metrics/bucket
将 HOSTNAME:PORT 替换为 MinIO 部署的FQDN和端口。对于使用负载均衡器管理 MinIO 节点之间连接的部署,请指定负载均衡器的地址。
版本 RELEASE.2023-10-07T15-07-38Z 中的新功能。
您可以使用以下 URL 端点抓取资源指标
http://HOSTNAME:PORT/minio/v2/metrics/resource
将 HOSTNAME:PORT 替换为 MinIO 部署的FQDN和端口。对于使用负载均衡器管理 MinIO 节点之间连接的部署,请指定负载均衡器的地址。
集群指标
MinIO 在集群级别收集以下指标。指标可能包含一个或多个标签,例如计算该指标的服务器。
这些指标可以通过以下 URL 从任何 MinIO 服务器每次收集获取一次
https://HOSTNAME:PORT/minio/v2/metrics/cluster
将 HOSTNAME:PORT 替换为您的 MinIO 部署的主机名。对于位于负载均衡器后面的部署,请使用负载均衡器主机名而不是单个节点的主机名。
审计指标
名称 |
描述 |
|---|---|
|
自启动以来发送失败的消息总数。 |
|
目标队列中未发送的消息数量。 |
|
自启动以来发送的消息总数。 |
集群容量指标
名称 |
描述 |
|---|---|
|
集群中在线的可用总容量。 |
|
集群中在线的总容量。 |
|
集群中在线的可用总容量。 |
|
集群中在线的总可用容量。 |
|
集群中对象大小的分布 |
|
集群中对象版本的分布 |
|
集群中的对象总数 |
|
集群总使用量(字节) |
|
集群中的版本总数(包括删除标记) |
|
集群中的删除标记总数 |
|
集群中的存储桶总数 |
集群驱动器指标
名称 |
描述 |
|---|---|
|
此集群中离线的驱动器总数。 |
|
此集群中在线的驱动器总数。 |
|
此集群中的驱动器总数。 |
集群 ILM 指标
名称 |
描述 |
|---|---|
|
转换到某个层级的总字节数。 |
|
转换到某个层级的对象总数。 |
|
转换到某个层级的版本总数。 |
集群 KMS 指标
名称 |
描述 |
|---|---|
|
报告 KMS 是否在线(1)或离线(0)。 |
|
因某些错误而失败的 KMS 请求数。(HTTP 4xx 状态码)。 |
|
因某些内部故障而失败的 KMS 请求数。(HTTP 5xx 状态码)。 |
|
成功的 KMS 请求数。 |
|
KMS 已经启动并运行的时间(秒)。 |
集群健康指标
名称 |
描述 |
|---|---|
|
离线的 MinIO 节点总数。 |
|
在线的 MinIO 节点总数。 |
|
所有池和集合中的最大写仲裁 |
|
获取当前集群健康状态 |
|
纠删集中的修复驱动器数量 |
|
纠删集中的在线驱动器数量 |
|
获取纠删集的读仲裁 |
|
获取纠删集的写仲裁 |
|
获取纠删集的当前健康状态 |
集群复制指标
标记为 仅站点复制 的指标仅在具有站点复制配置的部署上填充。对于具有存储桶或批量配置的部署,这些指标会改为在存储桶指标端点下填充。
名称 |
描述 |
|---|---|
|
(仅站点复制) 过去一小时内至少一次复制失败的总字节数。 |
|
(仅站点复制) 过去一小时内复制失败的对象总数。 |
|
过去一分钟内至少一次复制失败的总字节数。 |
|
过去一分钟内复制失败的对象总数。 |
|
(仅站点复制) 自服务器启动以来至少一次复制失败的总字节数。 |
|
(仅站点复制) 自服务器启动以来复制失败的对象总数。 |
|
(仅站点复制) 从另一个源集群复制到此集群的总字节数。 |
|
(仅站点复制) 此集群从另一个源集群接收的对象总数。 |
|
(仅站点复制) 复制到目标集群的总字节数。 |
|
(仅站点复制) 复制到目标集群的对象总数。 |
|
(仅站点复制) 自服务器启动以来的复制凭证错误总数 |
|
(仅站点复制)代理到复制目标的 GET 请求数 |
|
(仅站点复制)代理到复制目标的 HEAD 请求数 |
|
(仅站点复制)代理到复制目标的 DELETE tagging 请求数 |
|
(仅站点复制)代理到复制目标的 GET tagging 请求数 |
|
(仅站点复制)代理到复制目标的 PUT tagging 请求数 |
|
(仅站点复制)代理到复制目标的 GET 请求失败数 |
|
(仅站点复制)代理到复制目标的 HEAD 请求失败数 |
|
(仅站点复制)代理到复制目标的 DELETE tagging 请求失败数 |
|
(仅站点复制)代理到复制目标的 GET tagging 请求失败数 |
|
(仅站点复制)代理到复制目标的 PUT tagging 请求失败数 |
节点复制指标
标记为 仅站点复制 的指标仅在具有站点复制配置的部署上填充。对于具有存储桶或批量配置的部署,这些指标会改为在存储桶指标端点下填充。
名称 |
描述 |
|---|---|
|
活动复制工作线程总数 |
|
平均活动复制工作线程数 |
|
自服务器启动以来看到的最大活动复制工作线程数 |
|
报告复制链接是在线(1)还是离线(0)。 |
|
自上次离线事件以来复制链接离线的总持续时间(秒) |
|
自服务器启动以来复制链接的总停机时间(秒) |
|
平均复制链接延迟(毫秒) |
|
自服务器启动以来看到的最大复制链接延迟(毫秒) |
|
当前复制链接延迟(毫秒) |
|
当前复制传输速率(字节/秒) |
|
平均复制传输速率(字节/秒) |
|
自服务器启动以来看到的最大复制传输速率(字节/秒) |
|
过去一分钟内排队等待复制的对象总数 |
|
过去一分钟内排队等待复制的总字节数 |
|
自服务器启动以来排队等待复制的平均对象数 |
|
自服务器启动以来排队等待复制的平均字节数 |
|
自服务器启动以来看到的最大排队等待复制的字节数 |
|
自服务器启动以来看到的最大排队等待复制的对象数 |
|
过去 5 分钟内在复制积压中看到的对象总数 |
修复指标
名称 |
描述 |
|---|---|
|
当前自我修复运行中修复失败的对象。 |
|
当前自我修复运行中已修复的对象。 |
|
当前自我修复运行中扫描的对象。 |
|
自上次自我修复活动以来经过的时间(纳秒)。 |
节点间指标
名称 |
描述 |
|---|---|
|
节点间 TCP 拨号调用的平均时间。 |
|
节点间 TCP 拨号超时和错误的总数。 |
|
失败的节点间调用总数。 |
|
从其他对等节点接收的总字节数。 |
|
发送到其他对等节点的总字节数。 |
存储桶通知指标
名称 |
描述 |
|---|---|
|
对所有目标活动的并发异步 Send 调用数(已弃用,请改用 |
|
发送到目标失败的事件(已弃用,请改用 |
|
发送到目标的总事件数(已弃用,请改用 |
|
由于内存队列已满而跳过发送到目标的事件 |
|
对目标活动的并发异步 Send 调用数 |
|
当前暂存在为目标配置的 queue_dir 中的事件数。 |
|
发送(或)排队到目标的总事件数 |
S3 API 请求指标
名称 |
描述 |
|---|---|
|
带有 (4xx) 错误的 S3 请求总数。 |
|
带有 (5xx) 错误的 S3 请求总数。 |
|
客户端取消的 S3 请求总数。 |
|
带有 (4xx 和 5xx) 错误的 S3 请求总数。 |
|
总传入 S3 请求的易失性数量。 |
|
当前正在处理的 S3 请求总数。 |
|
因身份验证失败而被拒绝的 S3 请求总数。 |
|
因无效标头而被拒绝的 S3 请求总数。 |
|
无效 S3 请求总数。 |
|
因无效时间戳而被拒绝的 S3 请求总数。 |
|
S3 请求总数。 |
|
等待队列中的 S3 请求数。 |
|
API 调用中首字节时间的分布。 |
|
接收的 s3 字节总数。 |
|
发送的 s3 字节总数。 |
软件指标
名称 |
描述 |
|---|---|
|
MinIO 版本的 Git 提交哈希。 |
|
服务器的 MinIO 版本标签。 |
驱动器指标
名称 |
描述 |
|---|---|
|
驱动器上的可用总存储空间。 |
|
可用 inode 总数。 |
|
驱动器 API 存储操作的上一分钟平均延迟(微秒)。 |
|
此节点中离线的驱动器总数。 |
|
此节点中在线的驱动器总数。 |
|
此节点中的驱动器总数。 |
|
驱动器上的总存储空间。 |
|
驱动器上已使用的总存储空间。 |
|
自服务器启动以来的驱动器超时错误总数 |
|
自服务器启动以来的驱动器 I/O 错误总数 |
|
自服务器启动以来的驱动器 I/O 错误、超时总数 |
|
等待驱动器的 I/O 操作总数 |
身份和访问管理 (IAM) 指标
名称 |
描述 |
|---|---|
|
上次成功 IAM 数据同步的持续时间(毫秒)。 |
|
自上次成功 IAM 数据同步以来的时间(毫秒)。 |
|
自服务器启动以来失败的 IAM 数据同步次数。 |
|
自服务器启动以来成功的 IAM 数据同步次数。 |
信息生命周期管理 (ILM) 指标
名称 |
描述 |
|---|---|
|
队列中待处理的 ILM 过期任务数。 |
|
活动的 ILM 转换任务数。 |
|
队列中待处理的 ILM 转换任务数。 |
|
错过的即时 ILM 转换任务数。 |
|
自服务器启动以来为 ilm 操作检查的对象版本总数。 |
|
自服务器启动以来删除对象的生命周期检查的总操作结果 |
|
自服务器启动以来删除版本的生命周期检查的总操作结果 |
|
自服务器启动以来对象转换的生命周期检查的总操作结果 |
|
自服务器启动以来特定对象版本转换的生命周期检查的总操作结果 |
|
自服务器启动以来删除临时恢复的对象的生命周期检查的总操作结果 |
|
自服务器启动以来删除临时恢复的版本的生命周期检查的总操作结果 |
|
自服务器启动以来删除所有版本的生命周期检查的总操作结果 |
分层指标
名称 |
描述 |
|---|---|
|
从暖层下载的对象的末字节时间的分布 |
|
从暖层下载对象成功的请求数 |
|
从暖层下载对象失败的请求数 |
系统指标
名称 |
描述 |
|---|---|
|
MinIO 服务器进程打开的文件描述符总数限制。 |
|
MinIO 服务器进程打开的文件描述符总数。 |
|
正在运行的 go 协程总数。 |
|
进程从底层存储系统(包括缓存)读取的总字节数,/proc/[pid]/io rchar。 |
|
进程从底层存储系统读取的总字节数,/proc/[pid]/io read_bytes。 |
|
进程写入底层存储系统(包括页面缓存)的总字节数,/proc/[pid]/io wchar。 |
|
进程写入底层存储系统的总字节数,/proc/[pid]/io write_bytes。 |
|
进程花费的总用户和系统 CPU 时间(秒)。 |
|
驻留内存大小(字节)。 |
|
虚拟内存大小(字节)。 |
|
每个节点的 MinIO 进程启动时间,自 Unix 纪元以来的秒数。 |
|
每个节点的 MinIO 进程正常运行时间(秒)。 |
扫描器指标
名称 |
描述 |
|---|---|
|
自服务器启动以来完成的存储桶扫描总数。 |
|
自服务器启动以来开始的存储桶扫描总数。 |
|
自服务器启动以来扫描的目录总数。 |
|
自服务器启动以来扫描的唯一对象总数。 |
|
自服务器启动以来扫描的对象版本总数。 |
|
对内核的总读系统调用。/proc/[pid]/io syscr。 |
|
对内核的总写系统调用。/proc/[pid]/io syscw。 |
|
自上次扫描活动以来经过的时间(纳秒)。 |
版本 RELEASE.2025-03-12T17-29-24Z 中已更改: 出于性能原因,v2 指标有 100 个存储桶的限制。对于更多存储桶的指标,请改用v3 指标。
存储桶指标
MinIO 在存储桶级别收集以下指标。每个指标都包含 bucket 标签以标识相应的存储桶。指标可能包含一个或多个附加标签,例如计算该指标的服务器。
这些指标可以通过以下 URL 从任何 MinIO 服务器每次收集获取一次
https://HOSTNAME:PORT/minio/v2/metrics/bucket
将 HOSTNAME:PORT 替换为您的 MinIO 部署的主机名。对于位于负载均衡器后面的部署,请使用负载均衡器主机名而不是单个节点的主机名。
分布指标
名称 |
描述 |
|---|---|
|
存储桶中对象大小的分布,包含存储桶名称的标签。 |
|
存储桶中对象大小的分布,按版本数量 |
复制指标
这些指标仅在具有存储桶复制或批量复制配置的部署上填充。对于配置了站点复制的部署,选定的指标会在集群指标端点下填充。
名称 |
描述 |
|---|---|
|
过去一分钟内至少一次复制失败的总字节数。 |
|
过去一分钟内复制失败的对象总数。 |
|
过去一小时内至少一次复制失败的总字节数。 |
|
过去一小时内复制失败的对象总数。 |
|
自服务器启动以来至少一次复制失败的总字节数。 |
|
自服务器启动以来复制失败的对象总数。 |
|
复制延迟(毫秒)。 |
|
从另一个源存储桶复制到此存储桶的总字节数。 |
|
此存储桶从另一个源存储桶接收的对象总数。 |
|
复制到目标存储桶的总字节数。 |
|
复制到目标存储桶的对象总数。 |
|
自服务器启动以来的复制凭证错误总数 |
|
代理到复制目标的 GET 请求数 |
|
代理到复制目标的 HEAD 请求数 |
|
代理到复制目标的 DELETE tagging 请求数 |
|
代理到复制目标的 GET tagging 请求数 |
|
代理到复制目标的 PUT tagging 请求数 |
|
代理到复制目标的 GET 请求失败数 |
|
代理到复制目标的 HEAD 请求失败数 |
|
代理到复制目标的 DELETE tagging 请求失败数 |
|
代理到复制目标的 GET tagging 请求失败数 |
|
代理到复制目标的 PUT tagging 请求失败数 |
流量指标
名称 |
描述 |
|---|---|
|
此存储桶接收的 S3 字节总数。 |
|
此存储桶发送的 S3 字节总数。 |
使用情况指标
名称 |
描述 |
|---|---|
|
对象总数。 |
|
版本总数(包括删除标记) |
|
删除标记总数。 |
|
总存储桶大小(字节)。 |
|
总存储桶配额大小(字节)。 |
请求指标
名称 |
描述 |
|---|---|
|
存储桶上带有 (4xx) 错误的 S3 请求总数。 |
|
存储桶上带有 (5xx) 错误的 S3 请求总数。 |
|
存储桶上当前正在处理的 S3 请求总数。 |
|
存储桶上的 S3 请求总数。 |
|
客户端取消的 S3 请求总数。 |
|
每个存储桶的 API 调用中首字节时间的分布。 |
资源指标
MinIO 在节点级别收集以下资源指标。每个指标都包含 server 标签以标识相应的节点。指标可能包含一个或多个附加标签,例如驱动器路径、接口名称等。
这些指标可以通过以下 URL 从任何 MinIO 服务器每次收集获取一次
https://HOSTNAME:PORT/minio/v2/metrics/resource
将 HOSTNAME:PORT 替换为您的 MinIO 部署的主机名。对于位于负载均衡器后面的部署,请使用负载均衡器主机名而不是单个节点的主机名。
驱动器资源指标
名称 |
描述 |
|---|---|
|
驱动器上的总字节数。 |
|
驱动器上已使用的字节数。 |
|
驱动器上的总 inode 数。 |
|
驱动器上已使用的总 inode 数。 |
|
驱动器上每秒的读取次数。 |
|
驱动器上每秒读取的千字节数。 |
|
驱动器上读取请求被服务的平均时间。 |
|
驱动器上每秒的写入次数。 |
|
驱动器上每秒写入的千字节数。 |
|
驱动器上写入请求被服务的平均时间。 |
|
自启动以来磁盘繁忙的时间百分比。 |
网络接口指标
名称 |
描述 |
|---|---|
|
60 秒内接口上接收的字节数。 |
|
60 秒内接口上接收的字节数(平均值)自启动以来。 |
|
60 秒内接口上接收的字节数(最大值)自启动以来。 |
|
60 秒内的接收错误。 |
|
60 秒内的接收错误(平均值)。 |
|
60 秒内的接收错误(最大值)。 |
|
60 秒内传输的字节数。 |
|
60 秒内传输的字节数(平均值)。 |
|
60 秒内传输的字节数(最大值)。 |
|
60 秒内的传输错误。 |
|
60 秒内的传输错误(平均值)。 |
|
60 秒内的传输错误(最大值)。 |
CPU 指标
名称 |
描述 |
|---|---|
|
CPU 用户时间。 |
|
CPU 用户时间(平均值)。 |
|
CPU 用户时间(最大值)。 |
|
CPU 系统时间。 |
|
CPU 系统时间(平均值)。 |
|
CPU 系统时间(最大值)。 |
|
CPU 空闲时间。 |
|
CPU 空闲时间(平均值)。 |
|
CPU 空闲时间(最大值)。 |
|
CPU ioWait 时间。 |
|
CPU ioWait 时间(平均值)。 |
|
CPU ioWait 时间(最大值)。 |
|
CPU nice 时间。 |
|
CPU nice 时间(平均值)。 |
|
CPU nice 时间(最大值)。 |
|
CPU steal 时间。 |
|
CPU steal 时间(平均值)。 |
|
CPU steal 时间(最大值)。 |
|
CPU 1分钟负载平均值。 |
|
CPU 1分钟负载平均值(平均值)。 |
|
CPU 1分钟负载平均值(最大值)。 |
|
CPU 1分钟负载平均值(百分比)。 |
|
CPU 1分钟负载平均值(百分比)(平均值)。 |
|
CPU 1分钟负载平均值(百分比)(最大值)。 |
|
CPU 5分钟负载平均值。 |
|
CPU 5分钟负载平均值(平均值)。 |
|
CPU 5分钟负载平均值(最大值)。 |
|
CPU 5分钟负载平均值(百分比)。 |
|
CPU 5分钟负载平均值(百分比)(平均值)。 |
|
CPU 5分钟负载平均值(百分比)(最大值)。 |
|
CPU 15分钟负载平均值。 |
|
CPU 15分钟负载平均值(平均值)。 |
|
CPU 15分钟负载平均值(最大值)。 |
|
CPU 15分钟负载平均值(百分比)。 |
|
CPU 15分钟负载平均值(百分比)(平均值)。 |
|
CPU 15分钟负载平均值(百分比)(最大值)。 |
内存指标
名称 |
描述 |
|---|---|
|
节点上的可用内存。 |
|
节点上的可用内存(平均值)。 |
|
节点上的可用内存(最大值)。 |
|
节点上的缓冲区内存。 |
|
节点上的缓冲区内存(平均值)。 |
|
节点上的缓冲区内存(最大值)。 |
|
节点上的缓存内存。 |
|
节点上的缓存内存(平均值)。 |
|
节点上的缓存内存(最大值)。 |
|
节点上的空闲内存。 |
|
节点上的空闲内存(平均值)。 |
|
节点上的空闲内存(最大值)。 |
|
节点上的共享内存。 |
|
节点上的共享内存(平均值)。 |
|
节点上的共享内存(最大值)。 |
|
节点上的总内存。 |
|
节点上的总内存(平均值)。 |
|
节点上的总内存(最大值)。 |
|
节点上已使用的内存。 |
|
节点上已使用的内存(平均值)。 |
|
节点上已使用的内存(最大值)。 |
|
节点上已使用内存的百分比。 |
|
节点上已使用内存的百分比(平均值)。 |
|
节点上已使用内存的百分比(最大值)。 |