
我们将对dynamodb表进行更改,使 Lambda 无法向表中写入数据,从而触发告警。
导航到 DynamoDB 控制台, 选择以 ‘stress-test-table-’ 开头的表:



返回 AWS DevOps Agent Web 应用程序并进入 Incident Response。输入以下内容:
调查 DynamoDBWriteThrottleAlarm 告警
点击 Start Investigating…

观察 AWS DevOps Agent:
Agent 将需要几分钟时间来收集正确的数据并验证其假设

Agent 提供:
Alert Context:
Impact Analysis:
Root Cause Hypothesis:
Recommended Actions:
在调查中导航到 Root Cause 选项卡, 点击 Generate Mitigation Plan, 调查中出现新的 Mitigation Plan 选项卡

大约一分钟后,缓解计划将会出现, 按照缓解计划的说明来修复事件
在 AWS Console 中,点击右下角的 Cloudshell 来执行缓解说明中建议的任何 CLI 命令:

AWS DevOps Agent 可以评估最近的事件以识别改进机会,从而防止未来事件的发生并减少平均检测时间(MTTD)和平均恢复时间(MTTR)。运行可能需要一些时间,所以我们现在启动它,稍后再查看结果。
在 AWS DevOps Agent Web 应用程序中导航到 Prevention 页面,点击 Run Now:

等几分钟后生成结果,devops agent建议不要让其他用户在控制台更新capacity, 并把相应的权限给禁掉:
