Search

2025 클라우드 컴퓨팅 숙련 전수 Day4

잘 받는 기준 및 트러블슈팅

500에러가 발생되지 않아야 한다.
Duration (ALB에서 걸리는 시간을 봐야한다.)
ALB 메트릭 확인하기
IAM 권한문제 발생 시 CloudTrail 로그 확인하기
문제 발생 시 새로운 인스턴스를 뛰우는 방법도 하나의 방법이다.
블루 그린 배포
인플레이스 배포
인스턴스 하나만 사용하는 것도 방법중에 하나이다.
카오스 같은 경우 하나만 사용하면 곤란한 경우 발생할 수도 있다.
p99로 높게 뛰는거 보고 ALB 로그보고 어떤 타겟, API를 보고 어떤 특징이 있는지 파악하기
500 에러가 늘어난다는 것은 서버 쪽 문제이니까 ALB 로그를 보는것보다 서버 로그를 보는 것이 좋다.
서버로그를 S3에 백업하거나 CloudWatch로 보내기
서비스운영의 핵심은 observability이다. 즉 로그를 잘 분석해서 정확한 판단을 내릴줄 알아야 한다.
메트릭을 먼저 본 후 로그를 확인한다.
로그랑 메트릭의 모든 답이 있다.