Search

예상 시나리오

EMR을 통해서 불필요한 DB 트랜잭션이나 동작중인 적합하지 않은 트랜잭션에 대한 로그를 분석
분석이 끝난 데이터는 EMRFS(S3) 에 저장
1.
RDS에 dump 파일로 데이터 업로드
2.
RDS에서 트랜잭션 로그를 CloudWatch Logs에서 저장
3.
S3에 Spark 코드 업로드(CloudWatch Logs에 있는 RDS 트랜잭션 로그 분석)
Spark Operator를 이용해서 분석 진행
4.
분석이 끝난 결과는 EMRFS(S3)에 저장

공부 해야할 것

EMR File System
Spark Operator
RDS 트랜잭션 로그 및 분석

AWS Labs Architecture

EMR on EKS with Karpenter
S3에 분석할 데이터 업로드
S3에 분석에 사용할 PpSpark 코드 업로드
start-job-run을 통해 분석완료