관리
운영 및 Day-2 작업
초기 설정 이후 AisOpsFlow Enterprise를 건강하게 유지하기 위한 일반 운영 작업입니다.
Day-2 운영에 포함되는 것
초기 배포 후 운영자는 보통 다음을 관리해야 합니다.
- 상태 확인
- 실행 검토
- 백업과 가져오기 워크플로
- 공급자 설정
- Runner 인벤토리와 denylist 상태
전형적인 운영 작업
서비스 상태 확인
헬스 엔드포인트를 확인하고 Core, Runner, 필요한 플러그인이 모두 도달 가능한지 검증합니다.
실행 이력 검토
실행과 결정 추적 데이터를 사용해 다음을 파악합니다.
- 어떤 워크플로가 실행되었는지
- 어디에서 실패했는지
- 승인이 진행을 막았는지
공급자 관리
관리형 공급자 설정을 검토하고 채널/공급자 경로가 테넌트 기대와 맞는지 확인합니다.
백업 관리
새 운영 절차를 도입할 때는 export, validate, import 작업을 신중하게 사용합니다.
Runner 관리
인벤토리, 상태, denylist 제어를 사고 대응과 수명주기 관리의 일부로 검토합니다.
운영 권장 사항
- 환경 파일은 변경 관리 아래 둡니다.
- 복구 절차는 실제 의존 전에 시험합니다.
- 승인 단계가 많은 워크플로를 도입했다면 승인 적체를 모니터링합니다.
- 플러그인 비밀값과 자격 증명의 소유자를 명확히 합니다.
볼 만한 신호
- 헬스 엔드포인트 실패
- 반복되는 워크플로 재시도
- 공급자 전달 실패
- Runner 재연결 또는 오프라인 패턴
- 증가하는 승인 대기열