新闻中心

浏览量:0
2021-03-14 00:23
华为云计算
大数据
RedHat
修改系统密码
Cisco
修复文件系统
修改密码
VMware
修改系统密码
Cisco
大数据
修复文件系统
华为云计算
修改密码
RedHat
VMware

热门关键词

这里有最新的公司动态,这里有最新的网站设计、移动端设计、网页相关内容与你分享

[Aliyun-ACP] 云监控初体验

收藏

实验概述

本实验会自动创建一台已部署Nginx的ECS实例和一台负载均衡SLB实例。首先,使用阿里云云监控的 云服务监控 服务,配置并查看ECS实例和SLB实例的监控数据。然后,设置ECS实例的报警规则,并验证报警规则生效。之后,使用 站点监控 服务,监控已部署Nginx的站点的状态,并设置站点报警规则,验证报警规则。最后,清理云监控中的监控资源。

img1

实验目标

完成此实验后,可以掌握的能力有:

1. 使用云监控的管理控制台,监控ECS等阿里云产品

2. 创建报警规则,及时获取阿里云服务或站点的异常状态;

3. 使用站点监控,对网站进行监控。

4. 清理云监控中的监控资源

学前建议

了解ECS和SLB的基本操作

 

1.1 背景知识

    云监控(CloudMonitor)作为云服务的监控管理入口,能让用户快速了解各产品实例的状态和性能。云监控从站点监控、云服务监控、自定义监控三个方面来为用户提供服务。通过云监控管理控制台,用户可以看到当前服务的监控项数据图表,清晰了解服务运行情况。并通过设置报警规则,管理监控项状态,及时获取异常信息。云监控目前免费限量为用户提供监控服务。

云监控为用户提供了非常丰富的使用场景:

·       云服务监控:用户购买和使用云监控支持的阿里云服务后,可监控多种阿里云云服务的各项基础指标,比如:ECS的CPU使用率、内存使用率、公网流出流速(带宽)等。确保实例的正常使用,避免因为对资源的过度使用造成用户业务无法正常运转。云监控会根据用户设置的报警规则,在监控数据达到报警阈值时,发送报警信息。用户可以及时获取异常通知,并查询服务异常的原因。

          目前,云服务监控对用户开放的产品包括云服务器ECS、云数据库RDS、负载均衡、云数据库Memcache版、对象存储OSS、CDN、弹性公网IP、云数据库Redis版、消息服务、日志服务等,其它云产品的监控会陆续加入进来。

·       站点监控:支持提供多种协议的监控设置,可探测您站点的可用性、响应时间、丢包率。让用户全面了解站点的可用性,并在发生异常时,可以及时处理。

          站点监控目前支持8种协议的探测,探测点包括:杭州、青岛、北京,探测频率支持:1分钟、5分钟、15分钟。

·       自定义监控:补充“云服务监控”的不足,如果云监控服务未能提供您需要的监控项,那么,用户可以创建新的监控项并采集监控数据上报到云监控,云监控会对新的监控项提供“监控图表”展示和“报警”功能。

     本实验主要介绍如何使用云服务监控,以及使用“站点监控”对用户自建的网站进行监控。通过设置报警规则,用户可以及时发现站点的异常情况,并做出及时的处理。

 

img2

 

2.3 监控阿里云云服务

1.        本章节将介绍如何使用云监控对阿里云上的资源进行基础监控,本实验主要实现对ECS和负载均衡实例的基本监控。首先,在负载均衡实例中创建监听,然后,在ECS实例中安装云监控插件。最后,在云监控中查看ECS,负载均衡的监控数据。

说明:使用云监控对负载均衡实例进行监控时,不需要安装监控插件。但是,负载均衡实例中必须有监听。否则,云监控将无法对负载均衡实例进行监控。

2.        在云中沙箱平台手册左侧的 实验资源 栏中,查看本次实验使用的阿里云账号信息。点击 前往控制台,访问阿里云登录界面。

在阿里云登录界面,输入 实验资源 分配的 子用户账号 和 子用户密码。点击 登录

img3img4

3.        若出现阿里云主页,则点击 控制台,否则忽略,继续执行下一步。

img5

4.        进入阿里云管理控制台后,点击阿里云管理控制台的左上角 产品与服务,在弹出的下拉列表中,选择 云计算基础服务 ---> 网络 ---> 负载均衡,进入负载均衡管理控制台。

img6

5.        在负载均衡服务管理控制台的 实例管理 中,选择 实验资源 提供的 地域。之后在顶部的搜索栏中,左侧关键字下拉框选择 负载均衡ID,搜索框中填入负载均衡ID 后 点击 搜索。在查询结果中点击右侧的操作栏下的 管理,进入此台ECS实例的管理界面。

img7

6.        在负载均衡实例的管理页面,点击左侧栏中 监听,进入 监听配置 页面。当前负载均衡实例中,无任何监听。点击右侧的 添加监听,创建负载均衡的监听。

img8

            在 基本配置 页面中,输入如下参数:前端协议 选择 HTTP端口 设为 80后端协议 HTTP的端口也设为 80带宽峰值 为 1M。其余为默认设置。完成后,点击 下一步

img9

            在 健康检查配置 页面中,关闭 健康检查。完成后,点击 确认

img10

            页面提示监听配置成功,点击 确认。在 监听配置 页面,可以查看到一个状态为 运行中 的监听项。

img11

img12

7.        点击左侧栏中的 服务器,选择 后端服务器 ,点击 未添加的服务器,查看到当前有一台未添加到负载均衡后端的ECS服务器,点击实例右侧的 添加

img13

            在弹出的 添加后端服务器 页面中,默认添加到后端的ECS实例 权重 为 100。点击 确认,将ECS服务器加入负载均衡器后端。

       img14

             在 已添加的服务器 列表中,查看到新添加的ECS实例。

img15

8.        点击阿里云管理控制台的左上角 产品与服务,在弹出的下拉列表中,依次选择 云计算基础服务---监控与管理---云监控,进入云监控的管理控制台。

img16

9.        在 云监控 管理控制台的左侧栏中,查看到目前云监控主要提供的三种服务:站点管理,对网站进行监控;云服务监控,对阿里云中的多种产品和服务进行监控,目前云监控可以对 ECSRDS 等云产品进行监控;自定义监控,为用户提供定制化的监控项,用户可以根据自身的需求,自定义监控内容,并实时的上传数据,查看监控信息。

img17

10.        点击左侧栏 云服务监控 中的 云服务器ECS。出现更新提醒,选择 暂不更新。页面显示在 实验资源 提供的 地域 中有一台ECS实例。点击此台ECS实例中的 插件状态 的 点击安装,安装云监控插件。

说明:若ECS实例没有安装云监控插件,则无法使用云监控对ECS实例进行监控。

 

img18

img19

img20

        请等待1-2分钟,点击右上角的 刷新,当ECS实例的 ECS插件状态 变为 运行中,则完成ECS实例的插件安装。用户可以通过云监控管理控制台,查看此台ECS实例的监控数据。点击ECS实例右侧的 监控图表,实时查看更新的监控数据。

img21

11.        在监控图表页面中,云监控提供两类ECS的监控数据:ECS实例基础监控 操作系统级别监控指标。用户可以根据自己的需求,查看相关的数据,并根据数据分析目前ECS实例的性能,适当调整实例的配置。可以点击具体目标查看监控详情。

说明:若无数据,请稍等1-2分钟后,刷新页面。因为云监控服务需要一定时间获取监控数据。

 

img22

        在详情中,用户可以自定义图表中显示的时间、查看云监控的其它信息。

img23

 

12.        点击左侧栏 云服务监控 的 负载均衡,页面显示当前帐户下仅有一台负载均衡实例。点击负载均衡实例右侧的 监控图表,查看负载均衡实例的监控数据。

img24

13.        在负载均衡的监控图表页面中,用户可以查看到 流入流量流出流量 等信息。点击 监控图表 中的 流入流量 等监控项目,进入详细的图表页面。

说明:流入流量,从外部访问负载均衡所需要消耗的流量;流出流量,负载均衡访问外部所需要消耗的流量;新建连接数,在统计周期内新建立的连接数的均值。它统计的是客户端连接请求,其中活跃连接数、非活跃连接数统计的也是客户端到负载均衡的连接请求。流入数据包数,负载均衡实例每秒接到的请求数据包数量;流出数据包数,负载均衡每秒发出的数据包数量;活跃连接数,当时所有ESTABLISHED状态的连接,可以理解为并发量,但是不能等同。因为如果用户采用的是长连接的情况,一个连接会同时传输多个文件请求;非活跃连接数,指除established状态的其他所有状态tcp连接数。

img25

 

2.4 创建ECS监控报警规则

1.        在创建报警任务之前,首先,创建报警联系人。然后,将报警规则中选择报警联系人所在的联系人组,最后,验证在触发警报时,发送报警信息给报警联系人。

2.        点击云监控管理控制台左侧的 报警联系人,在报警联系人的页面中,默认当前阿里云账号的注册信息为报警联系人。点击页面右上角的 新建联系人,创建一个新的报警联系人。

img26

3.        在弹出的对话框中,输入 姓名,如:Connie,并输入 手机号 和 验证码。完成后,点击 保存

注意:此处请填写真实的手机信息,否则,将无法获取验证信息,在本实验的最后一个章节,会介绍如何清理已创建报警联系人。并请进行清理,避免个人信息泄漏。

img27

            在报警联系人的页面中,查看到新建用户,如:Connie(用户自定义姓名)和相应的手机号信息。

img28

4.        点击左侧栏中 云服务监控 类别下的 云服务器ECS ,进入ECS监控列表,选择 实验资源 提供的 地域 。点击ECS实例右侧的 报警规则。查看ECS实例的报警配置。

img29

            在ECS实例的报警规则列表下,查看到当前实例没有报警规则。点击页面右上方的 新建报警规则,创建新的报警规则。

img30

5.        在 设置报警规则 页面中,设置如下信息:规则名称 自定义,如:warning监控项 选择 CPU使用率统计周期 设为 1分钟统计方法 设为 只要有一次 、>=阈值 输入 80%连续几次超过阀值后报警 输入1。也就是,每分钟都会统计CPU的使用率,当有1次检测到的CPU使用率大于80%时,会触发报警规则。

img31

 

6.        然后,执行以下几步,完成 新建报警规则

1).        设置 通知方式,点击 快速创建联系人组

img32

 

2).        在弹出的 新建联系人组 的对话框中,配置如下信息:组名 为 EcsOps自定义),已选联系人 是将 已有联系人 中自建的报警联系人,如:Connie(用户自定义姓名),添加到 已选联系人。完成后,点击 确定

注意:在新建联系人组之前,必须在 报警联系人 中创建相应的报警联系人。若报警联系人加入到同一个联系人组中,则这个组中的所有报警联系人均会收到相同的报警的提示信息。

img33

3).        完成以上设置后,点击底部的 确认

img34

4).        弹出弹框,再次点击 确认

img35

 

 5).        此时,可以在 报警规则 的页面中,查看到 状态 为 正常 的 CPU实用率 的监控项。说明,当前ECS实例的CPU使用率<80%。

img36

8.        创建报警规则后,使用stress压测工具,增加CPU使用率,触发报警规则。首先,远程登录到沙箱 实验资源 提供的 网站服务器 ECS实例中。请使用本资源提供的ECS服务器的 弹性IP用户 和 密码

说明:远程登录Linux系统ECS实例的详细步骤,请参考云中沙箱 帮助文档

img37

9.        登录到ECS实例后,输入如下命令,增加ECS实例的CPU使用率。

# stress --cpu 8 --io 4 --vm 2 --vm-bytes 128M --timeout 10m

 

10.        返回云监控管理控制台,查看ECS实例监控数据:首先,点击云监控管理控制台左侧栏中的 云服务器ECS,选择 实验资源 提供的 地域 。然后,在右侧主界面中,选择 ECS实例 右侧的 监控图表;点击 CPU利用率,查看ECS实例的CPU利用率的详细数据信息。等待1-2分钟后,CPU使用率将达到100%。

img38

img39

11.        同时,在手机中会收到短信提示信息:ECS实例CPU百分比最大值超过80%。等待1-2分钟,压测结束,ECS实例回复正常,收到一条新的短信通知 CPU百分比回复正常。因此,在真实的工作环境中,通过设置报警规则,用户可以及时发现ECS的异常状态。

img40

 

2.5 使用云监控对站点进行监控

1.        云监控不仅可以对阿里云中的云资源进行监控,也可以使用云监控对自建Nginx服务器的站点进行监控,并设置报警规则,通过设置报警规则,及时发现站点异常现象,并对其处理。

说明:用户不仅可以对自己的站点进行监控,也可以对百度等网站进行监控。

2.        首先,在云监控管理控制台中,点击左侧栏的 站点管理,进入 站点监控 页面,点击右上角的 创建监控点,弹出创建对话框,开始创建站点监控。

img41

3.        在 创建监控点 的对话框中,站点类型 选择 HTTP监控点的名称 输入 Nginx服务器监控地址 输入  实例资源 提供的 负载均衡器的 IP地址监控频率 设为 1分钟。其余为默认设置,完成后,点击 确定。如上配置,可以实现每分钟监控负载均衡的访问IP地址的状态。

img42

            页面提示 站点监控创建成功,点击 设置报警规则,开始创建站点的报警规则。

img43

4.        在 设置报警规则 中,使用默认配置:状态码>=400,也就是当网站访问异常的时候,触发报警规则。完成后,点击 下一步

img44

5.        在 设置通知对象 中,配置如下参数:连续几次超过阈值后报警,选择 1报警方式选择 多检测点独立报警,也就是若在 创建站点监控 时,填写多个站点信息,只要一个站点异常,就会触发报警,而 多检测点组合报警,只有所有监测点均异常,才会报警;联系人通知组 勾选 EcsOps。完成后,点击 确定

img45

            对话框提示 已完成了1个站点的报警规则设置,点击 关闭。完成报警规则的创建。

img46

6.        在 站点监控 页面,可以查看到一个新建监控站点 Nginx服务器,等待1-2分钟后,可以查看到不同地域监控点的监控信息。

img47

7.        此时,停止负载均衡后端的ECS实例,模拟网站服务器异常,导致站点不可访问。点击顶部导航栏的 产品与服务 ,下拉列表依次选择 云计算基础服务 ---> 弹性计算 ---> 云服务器ECS,返回ECS管理控制台。点击左侧栏中 实例,在顶层栏中,选择云中沙箱 实验资源 提供的 地域,比如 华南1 。点击实例右侧的 更多,在弹出的下拉菜单中,点击 停止

img48

            在弹出的对话框中,选择 强制停止,并勾选 确定要强制停止。完成后,点击 确定

img49

8.        等待1分钟,ECS状态变为 已停止。此时,在浏览器中访问 实验资源 提供的 负载均衡器 的 IP地址,页面显示 504 错误。

img50

            同时,手机会收到报警短信,Nginx服务器发生错误,其状态码值为 504。在真实环境中,建议用户,尽快处理监控异常的网站,避免影响业务的正常使用。

img51

2.6 清理云监控

1.        当某个站点不再使用,或者用户不希望再获取来自云监控的报警信息时,用户需要对云监控进行清理。本实验主要进行如下内容的清理:监控站点 和 报警联系人信息 清理。

2.        首先,进入云监控管理控制台的 站点管理 页面,勾选不需要监控的网站。然后,点击列表下端的 批量删除

img52

        在弹出的对话框中,点击 确定。批量清理监控站点。

img53

3.        点击左侧栏 报警联系人,在 报警联系人 页面中,选择要清除的联系人,如:Connie(用户自定义姓名)右侧的 删除

注意:为了确保用户的个人信息安全,请务必删除自建的报警联系人的信息,避免个人信息泄漏,导致安全问题。

img54

            在弹出的提示对话框中,点击 确定。删除报警联系人 Connie

img55

至此,完成云监控的全部实验步骤。

 

首页    阿里云    [Aliyun-ACP] 云监控初体验