잘 받는 기준 및 트러블슈팅
•
500에러가 발생되지 않아야 한다.
•
Duration (ALB에서 걸리는 시간을 봐야한다.)
•
ALB 메트릭 확인하기
•
IAM 권한문제 발생 시 CloudTrail 로그 확인하기
•
문제 발생 시 새로운 인스턴스를 뛰우는 방법도 하나의 방법이다.
◦
블루 그린 배포
◦
인플레이스 배포
•
인스턴스 하나만 사용하는 것도 방법중에 하나이다.
◦
카오스 같은 경우 하나만 사용하면 곤란한 경우 발생할 수도 있다.
•
p99로 높게 뛰는거 보고 ALB 로그보고 어떤 타겟, API를 보고 어떤 특징이 있는지 파악하기
•
500 에러가 늘어난다는 것은 서버 쪽 문제이니까 ALB 로그를 보는것보다 서버 로그를 보는 것이 좋다.
•
서버로그를 S3에 백업하거나 CloudWatch로 보내기
•
서비스운영의 핵심은 observability이다. 즉 로그를 잘 분석해서 정확한 판단을 내릴줄 알아야 한다.
•
메트릭을 먼저 본 후 로그를 확인한다.
•
로그랑 메트릭의 모든 답이 있다.

