您现在的位置是:主页 > 云市场 >

云主机-监控关键Couchbase指标

2020-10-21 10:02云市场 人已围观

简介集成/度量/沙发座/performancejustinslattry@jdslatts是MLS软件开发的高级主管数字。At美国职业足球大联盟,我们已经在生产中使用数据狗快一年了。Datadog已经成为我们独有的性能监视和绘图...

监控关键Couchbase指标

集成/度量/沙发座/performancejustinslattry@jdslatts是MLS软件开发的高级主管数字。At美国职业足球大联盟,我们已经在生产中使用数据狗快一年了。Datadog已经成为我们独有的性能监视和绘图工具,因为它在易用性、灵活性和可扩展性之间找到了恰当的平衡,并为我们的团队提供了巨大的杠杆作用。我们很高兴Datadog团队决定让他们的代理成为一个开源项目。这使得创建您自己的定制支票并将其贡献给社区变得非常简单。六个月前,我们为Couchbase开了一张新支票。我们开发的Couchbase集成基于现有的CouchDB版本。自定义检查只是遍历Couchbase REST中可用的所有可能的度量API什么是Couchbase吗?如果你以前没听说过Couchbase是一个分布式NoSQL数据库。尽管有着相似的名字和共享的遗产,Couchbase是一个非常不同的产品,比更广为认可的CouchDB。我不会在这里讨论这两者之间的区别,优惠券返利,但是如果你以前没听说过,Couchbase肯定值得一看。我们在此基础上开发了多种产品,trustdata大数据,包括我们的API和实时匹配中心戈拉佐。是吗能够监控和分析Couchbase指标以及我们的应用程序指标对于识别和解决我们的产品。密钥Couchbase度量要有效地监控Couchbase,我们需要两个不同的视角:集群整体和个别应用桶。在在集群级别,我们要确定哪些bucket消耗最多资源。在在应用程序级别,我们想知道有多少请求没有被上游缓存处理并触发Couchbase操作。用于集群监控,我们按照bucket分解度量,这样我们就可以确定铲斗的负荷最大。对于应用程序监视,我们过滤到水桶。用我们监控以下指标。在一个简短的例子中,产业云,你将如何在一个简短的数据度量中找到它的度量公制操作每秒数据狗:couchbase.by_bucket公司.ops by{bucket}它度量的是:这个简单的度量简单地度量bucket上发生的get、set、incr和decrs的总数。这不包括任何视图操作。这种测量方法可以很容易地看到哪个应用程序/bucket获得最多的流量,并有助于容量规划和问题分类。很容易看到哪个应用程序/bucket获得的最多交通。查看Datadog中每秒的操作数:couchbase.by_bucket公司couch按{bucket}查看操作:在Couchbase中,视图是预计算的MapReduce索引函数。这个度量度量度量每个bucket中的视图被读取的次数。哪个应用程序滥用浏览量最多?数据狗中的当前连接:couchbase.by_bucket公司.currüu connections by{host}此度量值:此度量值仅计算每个主机的连接数。我们使用这个度量来确保我们的环境配置中没有任何意外情况,比如忘记向负载添加一个Couchbase节点平衡器总计数据狗中的对象:couchbase.by_bucket公司.curr\u items by{bucket}此度量值:此度量值统计每个bucket存储的对象总数。我们观察它来跟踪我们桶的增长率。我们的一些bucket的增长永远不会超过几千个对象,因此在这个图上增加数字将是一个警告签名。我们实际上,多亏了这个指标,果拉佐出现了一个严重的问题。一个失控的进程开始以惊人的速度向bucket添加新对象。下面的图表帮助我们在可能导致停机之前发现问题。哦,每日返利,这里有点不对劲…数据狗中的常住物品比率:couchbase.by_bucket公司.vb_active_resident_items_ratio by{bucket}此值衡量的是:此数字表示保存在内存中的项与存储在内存中的项的比率磁盘。那个此指标的预期值将因应用而异。我们预计我们的一些应用程序会保持在100%左右,而其他的则会在10%左右徘徊。理想情况下,你希望这个指标尽可能接近100%,这样你的应用程序最活跃的对象是"热"的,并且不会在请求时调用(非常)慢的磁盘读取。越高越好,但每个应用程序都会不同。记忆HeadroomIn数据狗:couchbase.by_bucket公司.ep mem_high_wat by{bucket}-couchbase.by_bucket公司{bucket}使用的.mem{bucket}这表示什么:如果使用的内存处于高水位线,则活动对象将被弹出。跟踪此值可以指示何时需要为bucket分配更多内存。下面的亮线表明我们的一个桶没有净空。不好的。其中一个存储桶内存不足…数据狗中的缓存未命中比率:couchbase.by_bucket公司.ep{bucket}/(couchbase.by_bucket公司.cmd_get by{bucket}*100)此度量:此复合度量统计从磁盘获取的请求对象与内存的比率。这个数字应该尽可能接近于零。您可以将它与常驻项目比率和内存净空指标结合使用,以了解存储桶是否有足够的容量来存储最多请求的对象记忆。那个下面的示例显示了当一个bucket开始耗尽将所有活动项保留在内存中的容量时的情况。这是和上面一样的桶。任何高于零的东西都是警告符号磁盘Datadog中每秒读取数:couchbase.by_bucket公司.ep_bg_由{bucket}获取的值:此度量值是每秒磁盘提取的原始数量。这个数字在我们的缓存未命中率计算中使用(如上所述),但它本身也值得观察,这样它就不会被更高的每秒获取次数所掩盖。磁盘读取的平均值应为零铲斗弹出数据狗:couchbase.by_bucket公司.ep_num_value_ejects by{bucket}此函数测量的内容:此函数测量从存储桶中弹出的对象数。此值的任何峰值都可能表示有问题,例如意外的内存压力桶。那个下面的例子显示了这种情况发生时的样子。这是与前三张图相同的桶。Couchbase正在将活动项目从内存中踢出,以便为新项目腾出空间对象。磁盘数据狗写入队列:couchbase.by_bucket公司.disk_write_queue by{bucket}这衡量什么:Couchbase最终将所有对象持久化到磁盘。此队列测量有多少对象正在等待写入磁盘。它应该总是一个低的数字。随着时间的推移越来越大,这表明集群不健康。下图显示了我们的一个应用程序在最近的数据迁移部署过程中出现的临时峰值。只要队列在正常负载期间保持低/零,就没有问题。我们的一个应用程序在部署。出去数据狗内存错误数:couchbase.by_bucket公司{ep和tmu}错误couchbase.by_bucket公司.ep_oom_errors by{bucket}这两个度量指标测量每秒由于内存压力而拒绝请求的次数。临时错误意味着Couchbase通过弹出对象来腾出更多空间,企业软件平台,请求应该稍后再试。非临时错误意味着存储桶已达到配额。非临时错误应触发警报。沙发座Metrics&DatadogCouchbase有大量可以监视的其他度量,Datadog集成公开了所有这些度量。幸运的是,管理GUI已经可视化地显示了大多数这些度量。只需找到一个要添加到Datadog中的度量并将鼠标悬停在它上面。工具提示将告诉您具体要测量的内容。如果你想获得这种可见性,你可以免费试用Datadog 14几天。卧铺也有很好的文档。如果您有兴趣了解更多关于这些指标的信息,或者更多关于Couchbase如何管理其内存和活动工作集的信息,我建议您阅读更多关于其建筑。如果您有兴趣了解更多关于MLS数码,请查看我们的博客!

Tags: 监控  指标  Couchbase  关键 

站点信息

  • 文章统计3903篇文章
  • 标签管理标签云
  • 微信公众号:扫描二维码,关注我们