ENTEC - 회고(16주차)
회고
개발이 완료되어 산출물 작업을 실시.
- ERD 작성
- 통합 테스트 시나리오 작성 및 진행
- 신메뉴 프로세스 매뉴얼 작성
또, 오늘 운영 서버가 갑자기 죽어버리는 긴급 문제가 터졌는데, 로그를 추적하여 문제를 해결함. 게이트웨이 로그 확인 결과 특정 파드가 요청을 처리하지 못하는 현상 발견(connection timed out) 모니터링 도구를 통해 해당 파드의 CPU가 폭주하는 시점을 확인하고, 로그 파일에서 해당 시점을 확인. 특정 지점에서 OutOfMemory 에러가 발생하는 것을 확인하여 후속 조치 진행 원인은 목록 데이터를 엑셀로 다운로드 시 데이터량이 많을 경우(이 경우에는 약 3만건) 힙 메모리가 꽉 차는 현상이 발생하는 것임이 확인됨. 하여 운영 서버의 메모리와 CPU를 조정하고, 엑셀 다운로드 기능에 방어 코드(row 수 제한)를 추가함
배운 점
- 운영에서는 정말 어떤 일이 벌어질 지 모르는 것 같다.
- 그래서 로그를 잘 남겨야 함을 배웠다. 왜냐하면 나중에 볼 수 있는건 로그 뿐이기에…