您现在的位置是:主页 > 云市场 >

spark大数据-使用top()函数对性能指标进行排名和筛选

2020-10-21 10:02云市场 人已围观

简介特征/指标/老实说,有时候你并不关心你所有的指标。也许你只想监视异常值,比如最大的内存占用者或工作最过度的主机。但是,如果您的仪表板图表如下所示,则要想消除这些指标...

使用top()函数对性能指标进行排名和筛选

特征/指标/老实说,有时候你并不关心你所有的指标。也许你只想监视异常值,比如最大的内存占用者或工作最过度的主机。但是,如果您的仪表板图表如下所示,则要想消除这些指标的混乱可能会很困难:此图是按进程细分的Datadog的输入吞吐量的度量,几乎无法解释。或者,您可以将这些度量可视化为热图,它将单个时间序列存储并聚合起来,以生成如下所示的结果:虽然这种可视化可以让您很好地了解工作在每一时刻是如何分配的,但要跟踪单个流程的角色则需要付出更多的努力。同时,第一张图中的几十条线并不容易追踪要么。数据狗的top()函数这种无法轻松消除度量混乱的能力是我们引入top()函数族的原因。top()函数系列为您提供了对性能指标进行排名、筛选和可视化的功能,这样您就可以专注于在任何给定的条件下对您最重要的指标时间。为了例如,通过查看过去一小时内平均值最高的五个指标,您可以创建如下内容:一目了然,这给了一个更简单和更清楚的看法,返利机器人,最辛苦的工作摄入量流程。如何要使用top()函数系列对性能指标进行排序和筛选top()函数支持多种方法对时间序列进行"排序"。我们这样设计函数是因为有时时间序列中的不同特性很重要。例如,您可能希望找到指标与:最高峰值最大持续平均值或最新最高值top()函数提供了执行上述分析以及其他一些分析的灵活性。下面是几个例子来说明使用top()进行排名和筛选的能力功能。这里我们将查看由查询生成的生产环境中按主机划分的系统负载系统负荷.1{*}通过{host}:这个查询生成了很多序列,乍一看,这些序列并没有提供太多的价值。但是,通过使用智能筛选并将查询从系统负荷.1{}按{host}到top5(系统负荷.1{}通过{host}),我们可以过滤掉"杂乱",并且只在时间窗口内查看平均值最高的五个系列。或者我们可以使用top5_max函数查找峰值并运行查询top5_max(系统负荷.1{*}通过{host})。注意这个视图如何显示比基本的"top5"行为更混乱、峰值更高的主机例如,如果您有兴趣按最新报告的值进行排名,您可以最后尝试查询top5\u(系统负荷.1{*}通过{host})。与前面的示例相比,此图从几个最近呈上升趋势的系列中选择,例如蓝色和紫色表示的主机台词。你呢也可以通过查询bottom5来反转排序顺序以查看排名最低的序列(系统负荷.1{*}通过{host})。此图显示给定时间段内负载最少的主机,如果您正在尝试在基础结构中快速找到可以安全生成新的主机的位置,这一点非常有用资源。高级度量过滤:顶部偏移函数假设您有一组度量,其中有一个巨大的异常值,这使得很难查看所有度量设置清楚。例如,以下面的查询为例平均:dd.sobotka.payload.reads{角色:sobotka}通过{pid}:这是我们的进气管道的另一个指标,显示了大量重叠的序列,有明显的异常值。由于离群值的影响,低值序列被压缩在一起,很难被压缩明白。和top_offset函数,云服务器如何,我们可以跳过离群值,集中在接下来的几个系列中,让我们更细致地了解度量值是如何在进程中分布的。我们可以通过执行查询top_offset来查看下两个系列(平均:dd.sobotka.payload.reads{角色:sobotka}通过{pid},3,'area',desc',1)得到如下图:虽然仍有一些噪音,但这张图上的过程在时间窗口上显示的峰值比第一张图上的要容易得多。您可以在下面找到top_offset函数的完整语法邮政信箱Datadog,我们一直在考虑更好的方法来使用您的度量来帮助您更好地理解您的基础设施。我们发现top()函数系列是深入了解我们的基础设施的一个强大工具,希望您也能从中受益。如果您想通过Datadog的top()函数家族来消除混乱,并获得查看最重要指标的能力,那么可以免费试用Datadog 14天.top()函数附录top()函数有以下语法:top(series_list,num_series,rank_method,order),其中:系列清单是一个度量将返回一个或多个序列的查询字符串,例如。,淘客引流,sum:system.mem.可用用户{role}num_series是一个整数,下面将更详细地描述从整个setrank_方法中获取的序列数,andorder是desc或asc,其中desc从最高到最低,asc从最低到最高对序列进行排序,我们计算一个数字,按该数字升序或降序对序列进行排序,然后从该列表中获取第一个numseries系列。用于计算数字的方法由rank_method参数给出。目前,我们支持以下方法气味:最大:按序列接管查询的最大值排序窗口.min:按接收查询的序列的最小值排序窗口平均值:按系列.面积:按序列随时间推移追踪出的区域进行排名,使用零作为参考标准点:与面积相似,但"norm"首先将每个系列点平方,以确保结果为正。当你对一系列的变化程度感兴趣时,这是很有用的零。最后:按中最后报告的值排序系列。Thetop_offset()函数有类似的参数:top(series_list,num_series,rank_method,order,offset)。前四个参数与给top()的参数相同,而最后一个参数给出"偏移量",即排名列表中要跳过的元素数绘图。那个top()函数有许多快捷方式,在下面的图表中进行了总结。如图所示,topN函数中的数字N可以取5、10、15或20。Shortcutnum_series(=N)方法asc/desctopn 5,10,15,20meandesctopN_max5,10,淘客是啥,15,20maxdesctopN_last5,10,15,20lastdesctopN_area5,10,15,20areadesctopN_norm5,10,15,20areadesctopN_norm5,10,15,20areadesctopNĖnorm5,10,15,20MeanasBottomn_max5,10,软件企业的认定,15,20maxascbottomN_last5,10,15,20lastascbottomN_last5,10,15,20areaascbottomN_norm5,10,15,20norm更多绘图功能和文档,请访问我们的文档网站。

Tags: 使用  指标  进行  筛选  函数  排名  性能 

站点信息

  • 文章统计3903篇文章
  • 标签管理标签云
  • 微信公众号:扫描二维码,关注我们