Rancher 2.0集群与工作负载告警

在Rancher 1.x时期,告警功能是很多Rancher用户一直希望能够集成进产品内的,因此在Rancher 2.0研发阶段,这一直是Rancher研发团队功能列表中的重要一项。

 

Rancher 2.0发布新版本产品中引入了很多酷炫新功能,其中就包括集群和工作负载的告警功能

 

通知程序

 

Rancher 2.0的告警功能让用户可以创建自定义警报,并将这些警报发送到多类多个后端系统上。

 

第一步,是创建通知程序。通知程序是在集群级别创建的。选择【工具/Tools】下拉菜单,在下拉菜单中选择【通知程序/Notifiers】,然后单击【添加通知程序/Add Notifier】,这将打开一个模式窗口,您可以从以下选项中进行选择。


1.png

您选择其中一个选项后,接着就需要填写与此选项相关的各种配置参数。比如在下图的Slack示例中,您可以看到有一个链接显示了如何配置通知程序。

 

 

2.png

 

添加完有效信息后,你就可以试着发送一个测试给通知程序了。Slack通知的示例如下:

 

 3.png


 

还有其他各类系统的通知接收工作,都可以通过webhook来完成。Webhook可以将通知发送到各种系统,这些系统具有自己的工作流,来处理已触发的特定警报。

 

集群级别的告警

 

返回到【工具/Tools】下拉菜单中,你能看到那里有一个【告警/Alerts】的选项。Rancher里设定了一些预先配置好的告警,不过在这些告警与通知程序关联好之前,它们是不会被触发的。

 

将告警与通知程序相关联非常简单,只需要编辑告警、设置通知程序、保存,就可以了。

 

要创建新的告警,只需单击【添加告警/Add Alert】,然后你就会看到下图的界面:

 

 

4.png

 

如你所见,您可以设置各种告警相关的选项,这些选项将会与系统或用户资源关联起来。在集群级别,您可以根据集群范围的资源(例如Node或实际的Kubernetes组件)设置告警。

 

工作负载级别的告警

 

工作负载级别的告警需要在【项目/Project】中设置。在【资源/Resources】的下拉列表中,有一个【告警/Alerts】菜单项,在此处单击【添加/add】,你将看到如下界面:

 

5.png

 

在项目(Project)告警中,您可以设置与实际应用程序工作负载相关的告警。例如,您可以设置如果您的服务未按您设置的规模运行,或者在指定的时间段内重新启动了一定次数,则收到告警通知。

 

结论

 

本文旨在简要介绍我们在Rancher 2.0中引入的新功能——告警。Rancher 2.0还在持续升级迭代之中,Rancher Labs研发团队将进一步更新与增强这些功能,为用户提供更优质更强大的体验。

 

您还可以在此链接中观看“Rancher 2.0实战训练营”在线培训中监控告警的这一期内容。未来我们会提供更多Rancher 2.0实操系列文档,敬请保持关注~


英文原文:https://rancher.com/blog/2018/cluster-workload-alerts/

相关文章
相关标签/搜索