本章节内容主要介绍openGemini自带的Kernel监控指标项,如果使用ts-monitor采集内核指标,会额外采集节点的内存利用率、cpu利用率、进程状态信息等,见system。
一般建议用户关注如下数据表内的指标项:
- Cluster_metric
- Httpd
- IO
- Measurement_metric
- RunTime
- System
建议内核开发者或在对openGemini非常熟悉的核心用户可以关注其他表内容,可以通过指标窥探到openGemini实际运行情况,帮助理解和性能参数优化。比如Record表,统计了内存池的使用情况,如果出现大量大内存申请的情况,可以适当考虑将内存池空间调大。
Grafana看板查询语句示例
CPU利用率
SELECT sum("usage")/count("usage") FROM (SELECT last("usage") as "usage" FROM (SELECT mean("CpuUsage") as "usage" FROM system WHERE time < xxx AND time > xxx GROUP BY time(1m),"host" FILL(null)) GROUP BY "host")
内存利用率
SELECT sum("use")/sum("total") FROM (SELECT last("MemInUse") as "use", last("MemSize") as "total" FROM system WHERE time < xxx AND time > xxx GROUP BY "host")
磁盘平均使用率
SELECT sum("use")/sum("total") FROM (SELECT last("DiskUsed") as "use", last("DiskSize") as "total" FROM system WHERE time < xxx AND time > xxx GROUP BY "host")
集群写流量趋势(万metrics/s)
SELECT difference("write")/1000/60 as cluster_write_qps FROM (SELECT sum("write") as "write" FROM (SELECT last("fieldsWritten") AS "write" FROM httpd WHERE time > xxx AND time < xxx GROUP BY time(1m),* FILL(linear)) GROUP BY time(1m) FILL(linear) LIMIT 718 offset 1
每个TS-SQL的写带宽(MB/s)
SELECT difference("writeReqBytes")/1024/1024/10 AS "mean_writeReqBytes" FROM httpd WHERE time > xxx AND time < xxx GROUP BY hostname
这里difference("writeReqBytes")/1024/1024/10
,采样周期时10s,最后除以10是计算每秒的数据
每个TS-SQL的写时延(ns)
SELECT difference("writeReqDurationNs")/difference("writeReq") AS "Duration" FROM httpd WHERE time > xxx AND time < xxx GROUP BY "hostname" FILL(null)
每个TS-STORE的写时延(ns)
SELECT difference("writeStorageDurationNs")/difference("WriteRowsBatch") AS "Duration" FROM performance WHERE time > xxx AND time < xxx GROUP BY "hostname" FILL(null)
每个TS-SQL的写QPS
SELECT difference("pointsWrittenOK")/10 FROM httpd WHERE time > xxx AND time < xxx GROUP BY "hostname" FILL(null)
采样周期时10s,最后除以10是计算每秒的数据
集群的查询QPS
SELECT difference("qr")/10 AS "QPS" FROM (SELECT sum(queryReq) AS "qr" FROM httpd WHERE time > xxx AND time < xxx GROUP BY time(10s))
采样周期时10s,最后除以10是计算每秒的数据
集群的查询时延
SELECT difference("duration")/difference("qr")/1000000 AS "latency" FROM (SELECT sum(queryReqDurationNs) AS "duration", sum(queryReq) AS "qr" FROM httpd WHERE time > xxx AND time < xxx GROUP BY time(2m))
磁盘写时延
SELECT mean(writeDuration)/mean(writeOkCount) FROM io WHERE time > xxx AND time < xxx GROUP BY(10s), hostname
Cluster_metric
指标名称 | 数据类型 | 说明 |
---|
DBCount | float | 集群中创建的DB总数 |
MstCount | float | 集群中所所有DB中表的总数 |
Compact(LSM-Tree文件合并相关指标)
指标名称 | 数据类型 | 说明 |
---|
Action | string | level/full,表示“level compact“ 还是 “full compact" |
App | string | 组件名 |
hostname | 组件Ip地址和端口 | |
level | 表示Compact发生的level,分[0-7] | |
measurement | Compact发生的表 | |
shard_id | Compact发生的shard | |
Active | float | 当前运行的Compact任务数量 |
CompactedFileCount | float | 单次任务,Compact后的文件数量 |
CompactedFileSize | float | 单次任务,Compact后的文件总大小 |
Duration | float | 单次Compact任务耗时 |
Errors | float | Compact错误次数 |
MaxMemoryUsed | float | Compact最大内存消耗 |
OriginalFileCount | float | 单次任务,Compact的源文件数量 |
OriginalFileSize | float | 单次任务,Compact的源文件总大小 |
Ratio | float | 单次任务,Compact的压缩率 |
RecordPoolGetTotal | float | 统计内存池分配Record对象的频次 |
RecordPoolHitTotal | float | Record对象池累计命中次数,用于衡量内存复用效果) |
DownSample(多级将采样相关指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
Active | float | 当前运行的将采样任务数量 |
Errors | float | 将采样任务运行过程中产生的错误数量 |
Engine(存储引擎相关指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
CloseDurations | float | 存储引擎关闭耗时 |
CloseErrors | float | 存储引擎关闭过程出现错误的次数 |
DelIndexCount | float | 存储引擎删除索引的总次数 |
DelIndexDuration | float | 存储引擎删除索引的总耗时 |
DelIndexErr | float | 存储引擎删除索引过程出现错误的次数 |
DelShardCount | float | 存储引擎删除Shard的总次数 |
DelShardDuration | float | 存储引擎删除Shard的总耗时 |
DelShardErr | float | 存储引擎删除Shard过程出现错误的次数 |
DropDatabaseCount | float | 存储引擎删除DB的总次数 |
DropDatabaseDurations | float | 存储引擎删除DB的总耗时 |
DropDatabaseErrs | float | 存储引擎删除DB过程出现错误的总次数 |
DropMstCount | float | 存储引擎删除表的总次数 |
DropMstDurations | float | 存储引擎删除表的总耗时 |
DropMstErrs | float | 存储引擎删除表过程出现错误的总次数 |
DropRPCount | float | 存储引擎删除RP的总次数 |
DropRPDurations | float | 存储引擎删除RP的总耗时 |
DropRPErrs | float | 存储引擎删除RP过程出现错误的总次数 |
OpenDurations | float | 存储引擎启动的总耗时 |
OpenErrors | float | 存储引擎启动过程中出现的错误次数 |
Errno(错误信息)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
errno | string | 错误码 |
module | string | 功能模块编码 |
value | float | 错误次数 |
Executor(查询引擎相关指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
agg_rows_count | float | 暂未启用 |
agg_rows_last | float | 暂未启用 |
agg_rows_sum | float | 暂未启用 |
column_length_count | float | 暂未启用 |
column_length_last | float | 暂未启用 |
column_length_sum | float | 暂未启用 |
column_width_count | float | 暂未启用 |
column_width_last | float | 暂未启用 |
column_width_sum | float | 暂未启用 |
dag_edge_count | float | 暂未启用 |
dag_edge_last | float | 暂未启用 |
dag_edge_sum | float | 暂未启用 |
dag_vertex_count | float | 暂未启用 |
dag_vertex_lsat | float | 暂未启用 |
dag_vertex_sum | float | 暂未启用 |
exec_abort_count | float | 查询计划的执行器被终止的总次数 |
exec_abort_last | float | 无意义,忽略 |
exec_abort_sum | float | 无意义,忽略 |
exec_failed_count | float | 查询计划的执行器执行失败的总次数 |
exec_failed_last | float | 无意义,忽略 |
exec_failed_sum | float | 无意义,忽略 |
exec_run_time_count | float | 查询计划的执行器执行总次数 |
exec_run_time_last | float | 最近一次执行时延 |
exec_run_time_sum | float | 查询计划的执行器执行总时长 |
exec_scheduled_count | float | 查询计划的执行器调度总次数 |
exec_scheduled_last | float | 无意义,忽略 |
exec_scheduled_sum | float | 无意义,忽略 |
exec_timeout_count | float | 查询计划的执行器超时总次数 |
exec_timeout_last | float | 无意义,忽略 |
exec_timeout_sum | float | 无意义,忽略 |
exec_wait_time_count | float | 查询计划的执行器申请内存资源总次数 |
exec_wait_time_last | float | 最近一次申请内存资源的等待时延(ns) |
exec_wait_time_sum | float | 查询计划的执行器申请内存资源是总时延(ns) |
fill_rows_count | float | 暂未启用 |
fill_rows_last | float | 暂未启用 |
fill_rows_sum | float | 暂未启用 |
filter_rows_count | float | 暂未启用 |
filter_rows_last | float | 暂未启用 |
filter_rows_sum | float | 暂未启用 |
goroutine_count | float | 查询计划的执行器执行总次数 |
goroutine_last | float | 最近一次查询计划执行时分配的goroutine数量 |
goroutine_sum | float | 总的goroutine数量 |
limit_rows_count | float | 暂未启用 |
limit_rows_last | float | 暂未启用 |
limit_rows_sum | float | 暂未启用 |
materialized_rows_count | float | 暂未启用 |
materialized_rows_last | float | 暂未启用 |
materialized_rows_sum | float | 暂未启用 |
memory_count | float | 查询计划的执行器执行总次数 |
memory_last | float | 最近一次查询计划执行时使用内存大小 |
memory_sum | float | 查询计划的执行器累计使用内存大小 |
merge_rows_count | float | 暂未启用 |
merge_rows_last | float | 暂未启用 |
merge_rows_sum | float | 暂未启用 |
sink_length_count | float | 暂未启用 |
sink_length_last | float | 暂未启用 |
sink_length_sum | float | 暂未启用 |
sink_rows_count | float | 总次数 |
sink_rows_last | float | 最近一次执行器执行时出口数据行数 |
sink_rows_sum | float | 执行器执行时出口数据总行数 |
sink_width_count | float | 总次数 |
sink_width_last | float | 最近一次执行器执行时出口数据列宽 |
sink_width_sum | float | 执行器执行时出口数据总列宽 |
source_length_count | float | 暂未启用 |
source_length_last | float | 暂未启用 |
source_length_sum | float | 暂未启用 |
source_rows_count | float | 总次数 |
source_rows_last | float | 最近一次执行器执行时入口数据行数 |
source_rows_sum | float | 执行器执行时入口数据总行数 |
source_width_count | float | 总次数 |
source_width_last | float | 最近一次执行器执行时入口数据列宽 |
source_width_sum | float | 执行器执行时入口数据总列宽 |
trans_abort_count | float | 暂未启用 |
trans_abort_last | float | 暂未启用 |
trans_abort_sum | float | 暂未启用 |
trans_failed_abort_count | float | 暂未启用 |
trans_failed_abort_last | float | 暂未启用 |
trans_failed_abort_sum | float | 暂未启用 |
trans_failed_count | float | 暂未启用 |
trans_failed_last | float | 暂未启用 |
trans_failed_sum | float | 暂未启用 |
trans_run_time_count | float | 暂未启用 |
trans_run_time_last | float | 暂未启用 |
trans_run_time_sum | float | 暂未启用 |
trans_wait_time_count | float | 暂未启用 |
trans_wait_time_last | float | 暂未启用 |
trans_wait_time_sum | float | 暂未启用 |
FileStat(存储文件信息)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
database | string | 数据库名 |
id | string | ?? |
measurement | string | 表名称 |
path | string | 数据文件路径 |
retentionPolicy | string | 数据库对应的数据保留策略名称 |
FileCount | float | 表的数据文件数量 |
FileSize | float | 表的数据文件大小 |
FileStat_Level(存储文件信息,按Compact Level维度统计)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
database | string | 数据库名 |
level | string | 数据文件Level |
FileCount | float | 数据库中,当前Level的数据文件总数 |
FileSize | float | 数据库中,当前Level的数据文件总大小 |
Httpd(对外相关统计信息)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
WriteMapRowsDurationNs | float | |
WriteStreamRoutineDurationNs | float | |
WriteUpdateIndexDurationNs | float | 暂未启用 |
authFail | float | 用户认证失败次数 |
clientError | float | 服务器返回4xx错误次数 |
connectionNum | float | 客户端连接数量 |
fieldsWritten | float | 写入的field列数 |
pingReq | float | 收到的ping请求数 |
pointsWrittenDropped | float | 批量写入时,部分写失败的数据总条数 |
pointsWrittenFail | float | 写失败的数据条数(全部失败) |
pointsWrittenOK | float | 写成功的数据条数 |
query400ErrorStmtCount | float | 查询时,服务器400错误的次数 |
queryErrorStmtCount | float | 查询失败的查询语句数量 |
queryReq | float | 接收到客户端查询请求数量 |
queryReqActive | float | 当前活跃的查询请求数量 |
queryReqDurationNs | float | 累计查询时延(ns) |
queryRespBytes | float | 查询返回的数据总量(按Byte计算) |
queryStmtCount | float | 查询语句总数 |
recoveredPanics | float | 处理程序Panic的总次数 |
req | float | 累计接收客户端请求数(含读和写) |
reqActive | float | 当前活跃请求数 |
reqDurationNs | float | 所有请求的累计响应时延(ns) |
scheduleUnmarshalDns | float | 数据反序列化累计耗时 |
serverError | float | 服务器返回5xx错误累计次数 |
statusReq | float | '/status'接口接收到的请求数 |
write400ErrReq | float | 找不到数据库、权限不足等问题导致的错误累计次数 |
write500ErrReq | float | 写数据出现服务器内部错误的累计次数 |
writeCreateMstDurationNs | float | 写时创表过程的时延(ns) |
writeCreateSgDurationNs | float | 写时创建ShardGroup过程的时延 |
writeReq | float | 服务器接收到写请求累计次数 |
writeReqActive | float | 当前活跃的写请求数量 |
writeReqDurationNs | float | 写数据累计时延(ns) |
writeReqBytes | float | 写入成功的总数据量(按Byte计算) |
writeReqBytesIn | float | 总的写数据量(含写失败和写成功) |
writeReqParseDurationNs | float | 解析写入数据格式的累计时延 |
writeStoresDurationNs | float | 数据写存储引擎的累计时延 |
writeUnmarshalSkDurationNs | float | 暂未启用 |
writeUpdateSchemaDurationNs | float | 更新表元数据(如新增Field)过程产生的累计时延(ns) |
IO
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
readActiveBytes | float | 暂未启用 |
readActiveCount | float | 暂未启用 |
readCacheCount | float | 暂未启用 |
readCacheMem | float | 存储引擎读文件时使用的block cache大小 |
readCacheRatio | float | block cache命中率 |
readDuration | float | 读文件的IO累计时延 |
readOkBytes | float | 读文件IO成功读取的累计数据量(按Byte计算) |
readOkCount | float | 读文件IO成功的次数 |
readTotalBytes | float | 读IO总的数据量(按Byte计算) |
readTotalCount | float | 读IO总的次数 |
snapshotSize | float | 快照文件大小(累计,按Byte计算) |
snapshotCount | float | 快照次数 |
syncActiveCount | float | 暂未启用 |
syncDuration | float | 累计刷盘File.Sync()时延(ns) |
syncOKCount | float | 成功刷盘的次数 |
syncTotalCount | float | 总的刷盘次数 |
writeActiveBytes | float | 暂未启用 |
writeActiveCount | float | 暂未启用 |
writeDuration | float | 累计写IO时延(File.Write()) |
writeOkBytes | float | 写文件IO成功写入的累计数据量(按Byte计算) |
writeOkCount | float | 写IO次数 |
writeTotalBytes | float | 写IO总数据量(按Byte计算) |
writeTotalCount | float | 写IO总次数 |
Measurement_metric
指标名称 | 数据类型 | 说明 |
---|
database | string | 数据库名 |
measurement | string | 表名 |
seriesCount | float | 时间线数量 |
Merge(文件合并相关指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
Measurement | string | 表名 |
ShardId | string | 分片ID |
Active | float | 当前运行中的乱序数据合并任务数 |
CurrentOutOfOrderFile | float | 暂未启用 |
Duration | float | 暂未启用 |
Errors | float | 乱序合并时出现错误累计次数 |
MergeFileCount | float | 单次任务,乱序合并后的文件总数 |
MergeFileSize | float | 单次任务,乱序合并后的文件总大小 |
OrderFileCount | float | 单次任务,有序文件总数 |
OrderFileSize | float | 单次任务,有序文件总大小 |
SkipTotal | float | 单次任务,不满足乱序合并条件,跳过合并的次数 |
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
Host | string | store节点地址 |
NodeID | string | store节点ID |
LTime | float | ts-meta管理的ts-store用的逻辑时钟,确保seriesID递增 |
LeaderSwitchTotal | float | leader节点故障导致切主的累计次数 |
SnapshotDataSize | float | 将当前系统状态(如节点信息等)写入快照的数据大小 |
SnapshotTotal | float | 保存系统状态的次数(通过快照保存) |
SnapshotUnmarshalDuration | float | ts-sql获取meta全量元数据时,meta向sql回复的快照数据反序列化时延(ns) |
Status | float | meta节点状态,1(健康), 4(故障) |
storeApplyTotal | float | 集群管理类、DDL类命令需要在ts-meta上创建元数据,会调用Apply()方法存储数据,这里统计总次数 |
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
NodeID | string | ts-meta节点ID |
Status | float | 节点角色,0(follower), 1(cadidate), 2(leader) |
foo | float | 无意义,后期版本将删除 |
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
FlushOrderRowsCount | float | 下盘的有序数据总行数 |
FlushRowsCount | float | 下盘的数据总行数(含有序和乱序) |
FlushSnapshotCount | float | 存储引擎缓存数据刷盘次数 |
FlushSnapshotDurationNs | float | 缓存刷盘的累计时延(ns),包括申请资源、缓存数据排序、刷盘、资源释放、删除WAL日志等过程 |
FlushUnOrderRowsCount | float | 下盘的乱序数据总行数 |
SnapshotFlushChunksNs | float | 特指FlushChunks方法刷盘的累计时延(ns) |
SnapshotHandleChunksNs | float | 无意义,后期版本将删除 |
SnapshotSortChunksNs | float | 特指刷盘前排序过程的累计时延(ns) |
WriteActiveRequests | float | ts-store节点上, 当前正在写入的任务数 |
WriteAddSidRowCountNs | float | 暂未启用 |
WriteCreateShardNs | float | ts-store节点上,创建新的分片(shard)累计时延(ns) |
WriteFieldsCount | float | ts-store节点上,写入的指标列(Field)的总数 |
WriteGetMstInfoNs | float | ts-sotre节点上,写入数据时查询表信息的累计时延 |
WriteGetTokenDurationNs | float | ts-sotre节点上,写入数据时,流控逻辑中等待资源分配的累计时延(ns) |
WriteIndexDurationNs | float | ts-store节点上,写入数据时创建索引的累计时延(ns) |
WriteMstInfoNs | float | ts-store节点上,写入缓存的累计时延(特指在write_rows方法中的写时延) |
WriteReqErrors | float | ts-store节点上,写数据出错的总次数 |
WriteRowsBatch | float | ts-store节点上,批量写入的次数,衡量数据写入频次 |
WriteRowsCount | float | ts-store节点上,数据写入总的行数 |
WriteRowsDurationNs | float | ts-store节点上,写入缓存的累计时延(粒度比WriteMstInfoNs更粗) |
WriteShardKeyIdxNs | float | ts-store节点上,创建ShardKeyIndex的总时延 |
WriteSortIndexDurationNs | float | ts-store节点上,写索引数据之前索引数据排序的总时延(ns) |
WriteStorageDurationNs | float | ts-store节点上,整个写入流程的总时延 |
WriteUnmarshalNs | float | ts-store节点接收到数据后,反序列化所需时延(累计) |
WriteWalDurationNs | float | 写WAL累计时延(ns) |
record(内存池相关指标)
openGemini内部大量使用内存池,根据作用范围可分为:
- AggPool
- CircularRecordPool
- FileCursorPool
- IntervalRecordPool
- SequenceAggPool
- SeriesPool
- TsmMergePool
- TsspSequencePool
每一种Pool采集Abort(累计值)/Get(累计值)/ReUse(累计值)/InUse(当前值)四类指标,分别表示对象申请内存空间过大,不再放回内存池,直接释放的次数;申请内存次数;内存复用的次数;正在使用的内存对象个数。可用于内核参数调优的依据。
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
AggPoolAbort | float | 内存直接释放的次数 |
AggPoolGet | float | 申请内存次数 |
AggPoolGetReUse | float | 内存复用的次数 |
AggPoolInUse | float | 正在使用内存的对象个数 |
CircularRecordPoolAbort | float | 内存直接释放的次数 |
CircularRecordPoolGet | float | 申请内存次数 |
CircularRecordPoolGetReUse | float | 内存复用的次数 |
CircularRecordPoolInUse | float | 正在使用内存的对象个数 |
FileCursorPoolAbort | float | 内存直接释放的次数 |
FileCursorPoolGet | float | 申请内存次数 |
FileCursorPoolGetReUse | float | 内存复用的次数 |
FileCursorPoolInUse | float | 正在使用内存的对象个数 |
IntervalRecordPoolAbort | float | 内存直接释放的次数 |
IntervalRecordPoolGet | float | 申请内存次数 |
IntervalRecordPoolGetReUse | float | 内存复用的次数 |
IntervalRecordPoolInUse | float | 正在使用内存的对象个数 |
SequenceAggPoolAbort | float | 内存直接释放的次数 |
SequenceAggPoolGet | float | 申请内存次数 |
SequenceAggPoolGetReUse | float | 内存复用的次数 |
SequenceAggPoolInUse | float | 正在使用内存的对象个数 |
SeriesPoolAbort | float | 内存直接释放的次数 |
SeriesPoolGet | float | 申请内存次数 |
SeriesPoolGetReUse | float | 内存复用的次数 |
SeriesPoolInUse | float | 正在使用内存的对象个数 |
TsmMergePoolAbort | float | 内存直接释放的次数 |
TsmMergePoolGet | float | 申请内存次数 |
TsmMergePoolGetReUse | float | 内存复用的次数 |
TsmMergePoolInUse | float | 正在使用内存的对象个数 |
TsspSequencePoolAbort | float | 内存直接释放的次数 |
TsspSequencePoolGet | float | 申请内存次数 |
TsspSequencePoolGetReUse | float | 内存复用的次数 |
TsspSequencePoolInUse | float | 正在使用内存的对象个数 |
RunTime(运行时内存指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
Alloc | float | 已分配但未释放的内存大小 |
CpuUsage | float | cpu利用率 |
Frees | float | 累计释放堆对象的内存大小 |
HeapAlloc | float | 同Alloc |
HeapIdle | float | 空闲(未使用)Span内存大小,衡量内存碎片程度 |
HeapInUse | float | 使用中的内存(最大值) |
HeapObjects | float | 累计分配的堆对象总数 |
HeapReleased | float | 返还给OS的物理内存大小 |
HeapSys | float | 从OS为堆申请的内存大小 |
Lookups | float | 运行时执行的指针查找数 |
Mallocs | float | 分配堆对象的累计数量 |
NumGC | float | 完成的GC数量 |
NumGoroutine | float | 产生的Goroutine数量 |
PauseTotalNs | float | 从程序开始时累计暂停时长(ns) |
Sys | float | 从OS申请的内存大小 |
TotalAlloc | float | 累计为对象分配的内存大小,衡量内存累计使用量 |
spdy(组件间连接复用相关指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
link | string | 连接方向"sql2meta","sql2store" |
remote_addr | string | 对端IP地址 |
connTotal | float | 全部连接数(内部) |
successCreateSessionTotal | float | 成功创建的连接会话数量 |
stream(流计算相关指标)
指标名称 | 数据类型 | 说明 |
---|
StreamFilter | float | 流式聚合中条件过滤的次数 |
StreamFilterNum | float | 流式聚合中条件过滤处理的数据行数 |
StreamIn | float | 流式聚合中,写管道次数 |
StreamInNum | float | 流式聚合中,写入管道的总数据行数 |
Stream_window(流式窗口聚合指标)
指标名称 | 数据类型 | 说明 |
---|
app | string | 组件名 |
hostname | string | 组件IP地址和端口 |
window | string | 流式聚合的窗口 |
System(节点指标)
指标名称 | 数据类型 | 说明 |
---|
host | string | 组件IP地址和端口 |
AuxDiskSize | float | 辅助磁盘容量,一般将WAL文件存储在不同的磁盘上,提高数据的安全性,见ts-monitor.conf aux-disk-path配置项 |
AuxDiskUsage | float | 辅助磁盘空间使用率 |
AuxDiskUsed | float | 辅助磁盘已使用容量 |
CpuNum | float | 节点CPU核数 |
CpuUsage | float | 节点CPU利用率 |
DiskSize | float | 节点主磁盘容量 |
DiskUsage | float | 节点主磁盘空间使用率 |
DiskUsed | float | 节点主磁盘已使用磁盘容量 |
IndexUsed | float | 索引数据使用磁盘容量 |
MemCacheBuff | float | 内存的缓存和缓冲区大小 |
MemInUse | float | 已使用的内存大小 |
MemSize | float | 节点内存容量 |
MemUsage | float | 节点内存使用率 |
MetaPid | float | ts-meta的进程ID |
MetaStatus | float | meta进程状态,1(runing) 0(killed) |
SqlPid | float | ts-sql的进程ID |
SqlStatus | float | sql进程状态,1(runing) 0(killed) |
StorePid | float | ts-store进程ID |
StoreStatus | float | store进程状态,1(runing) 0(killed) |
Uptime | float | 节点运行时长(s) |