퍼블릭 클라우드 도입으로 이루는 효과

- 손쉬운 확장성으로 컴퓨팅자원 (CPU, Memory, Disk 등)의 초기 과잉투자 예방
- IT 기반 설비 (전원, 케이블, 공조등) 구축 및 운용에 대한 인력 및 비용 절감
- 유연한 컴퓨팅 자원 할당으로 신규 프로젝트를 신속하게 구현, 테스트, 검증하고 실제 서비스 투입하여 Time to Market 실현 / 리스크 최소화
- 클라우드 제공자의 글로벌 환경으로 서비스 확장 용이
퍼블릭 클라우드 도입으로 IT Ops가 거두는 효과

- 하드웨어등 물리적 설비 관련 업무 감소
- 사람의 개입이 필요한 물리적인 작업 (전원 ON/OFF, 디스크 교체 등)이 없으므로 언제 어디서나 원격으로 서비스 요구 대응 / 장애 대처 / 복구
- 신속한 컴퓨팅 자원 배치 (Provisioning) 및 변경
- 컴퓨팅 자원의 관리를 위한 공간적 / 시간적인 제약이 없어지므로 담당할 수 있는 컴퓨팅 자원이 확대되고 생산성 향상
클라우드 도입에 따른 IT Ops 해결 과제

- 쉬운 Provisioning 과 함께 IT OPS 가 담당해야 할 컴퓨팅 자원의 수가 급격히 늘어났지만 장애 대비활동 등의 일일 관리측면에서는 클라우드 서비스가 제공하는 바가 크지 않다.
- 물리적인 서버와 달리 가상의 ID 번호등으로 구별되는 가상 서버와 그 부속 자원은 IT 담당 인력이 해당 자원을 인지하고 관리하는데 큰 혼동을 야기하며 작업실수를 더 많이 유발한다.
- 최고의 가용성을 자랑하고 전세계에 무수한 사용자를 확보하고 있는 클라우드를 사용하고 있어서 간과하기 쉽지만 개개의 클라우드 자원은 노후하고 반드시 Fail 한다. 전통적인 IT 인프라에서 진행하던 인프라 업데이트, 장애 복구 대책 등이 그대로 필요하다.
장애 비용 (Cost of Downtime)

- 기업 평균 장애 비용 ( Gartner ) - 시간당 약 5천 만원
- IT 운용 효율성과 유연성이 좋아져서 장애복구 시간은 어느 정도 줄일 수 있게 되었지만 장애에 의한 시간당 손실은 예전과 같음
- Fortune 1000 기업 ( IDC, 2014 )
- 인프라 장애에 의한 평균 비용 - 시간당 1억 2천만원
- 핵심 Application 장애에 의한 평균 비용 - 시간당 6억 ~ 12억
- 평소 백업, 업그레이드, 롤백 등에 대한 자동화 작업을 진행하여 장애 상황에서 안정적으로 신속한 복구를 수행하는 것이 관건
- 장애 유형과 복구 시간 (Quorum Disaster Recovery Report 2013)
- H/W 55%, S/W 18%, Human 22%
- Small and Mid Company 평균 장애 복구 시간 - 약 30 시간
자동화 (Automation)의 목표

- 클라우드 도입 후 자동화는 '있으면 좋은(nice to have)' 아이템이 아니라 '필수 (a must)' 이다. IT 스태프는 n개의 서버와 부속시스템을 담당하는 것이 아니라 10n 개 이상을 다루게 된다.
- 생산성 - 담당하는 서버 댓수 확장
- 정확성 / 일관성 - 수동으로 하는 것보다 에러가 적다. 딴생각을 하거나 시간이 지나면서 작업에 관심을 잃어버리는 경우가 없다.
- 신속성 / 시간절약 - 사람이 수동으로 하게 되면 생각하는 시간, 입력하는 시간이 추가되고 실수가 발생할 소지가 많이 생긴다. 또한 실수를 수정하기 위해 많은 시간을 보내게 된다.
- 대기 시간 단축 - 한가지 단계를 수행하고 다음 단계로 넘어가기 위해서는 늘 전 단계가 완료될 때까지의 대기시간이 존재한다. 수동 프로세스에서는 작업자가 '기다렸다가 서둘러 다음 작업을 진행' 하는 패턴으로 불 필요한 집중을 요한다.

- 현재 자동화 되어 있지 않은 IT Ops 단위 업무의 3가지 카테고리
- 자동화 작업을 진행해야 하는데 시간 / 인력이 부족한 업무
- 자동화 했을 때의 개선 효과가 별로 없는 업무
- 자동화 할 수 없는 업무
자동화 (Automation)의 현황
- 가장 많이 쓰이는 IT Ops 업무 자동화 도구
- Shell Script (77%)
- "누구에게나 맞는 신발은 없다"
- 작은 범위로 즉시 사용할 수 있는 자동화 부터 시작하자.
- 아무리 공들여 만든 스크립트도 모든 경우를 커버할 수는 없다.
- 테스트와 결과물을 꾸준히 분석하여 더 좋은 자동화를 구현하자.
- 자동화 프로세스의 두가지 유형
- Time Based - Cron, Schedule
- Logic Based - 다른 단위 업무와의 종속성

- 메뉴 운용 (Menu Driven) 방식으로 별도의 추가 지식 습득이 필요없이 직관적으로 Orchestration 할 수 있습니다.
왜 robustack 인가
- Bash (Bourn Again Shell) 사용 능력 이외의 어떠한 추가 지식도 필요하지 않기 때문에 거의 모든 IT Ops (DevOps or Traditional Ops) 인력이 즉시 사용할 수 있습니다.
- 자동화 프로세스의 두가지 유형 Time Based 와 Logic Based 자동화를 모두 지원하며 두 유형을 조합하여 자동화를 구현할 수도 있습니다.
- Time Based - Schedule Job
- Logic Based - Sequence Job, Trigger Job
- Combined - Sequence Job in Schedule, Trigger Job in Schedule, Schedule suspend/resume in Sequence Job
- Amazon EC2 상의 컴퓨팅 자원 배치 (Provisioning) 와 구성 관리 (Configuration Mgmt), 그리고 자동화 (Automation)를 구현할 수 있는 클라우드 자원 라이프 사이클 전반을 다루는 Orchestration 도구를 제공합니다.

- Follow the Sun - 전세계 지역에 따라 사용자가 몰리는 시간을 예상하여 주기적으로 추가성능을 제공하는 서비스 그룹을 투입 또는 배제하기
robustack 활용예
- Auto Scaling - 응용프로그램의 상태나 Bash Script의 결과 값에 따라 준비된 서버 그룹을 배치하거나 배치 해제하기
- Rolling Upgrade - 고객 서비스 중단을 최소화 하면서 응용프로그램 업그레이드 하기
- Provisioning for Test, QA, UAT - 개발이 완료된 서비스의 서버그룹과 그 부속자원(서버, 볼륨, 보안그룹 등) 또는 운용중인 서비스 그룹을 통째로 복제 (Clone) 하여 테스트 용도로 사용하기

왜 robustack 인가
By robustack.com
왜 robustack 인가
퍼블릭 클라우드를 도입한 기업에 Orchestration 도구는 '있으면 좋은(Nice to Have)' 이 아닌 '필수(a MUST)' 아이템입니다. robustack은 IT Ops가 클라우드 도입으로 마주하게될 골치아픈 업무들에 대한 비상구입니다.
- 703