"인구 200만 공공기록, 클라우드에 담아보니"

미국 워싱턴주 최대 카운티의 AWS 활용기

컴퓨팅입력 :2015/10/19 16:47    수정: 2015/10/19 17:02

공공기관에서 수십년간 보존해야 할 자료를 물리적 장비가 아닌 퍼블릭클라우드 인프라에 맡겨도 될까? 이를 가능성 검토 수준이 아니라 이미 실행에 옮긴 IT인프라 운영 사례가 공개됐다. 지난달 28일 '클라우드발전법' 발효로 정보화사업 예산 편성시 클라우드 활용을 고려할 공공기관들이 참고할 만하다.

공공기관 활동으로 상시 발생하는 자료는 법적으로 짧게는 몇 년, 길게는 수십년 이상 보관해야 한다. 이런 공공기록은 그간 종이 문서 형태로 보관됐고, 행정 전산화 이후에는 '테이프스토리지'라는 디지털 데이터를 위한 장비를 통해 저장돼 왔다. 자료 입출력 과정은 불편하나 안정성은 높다는 평가를 받았다.

지난주 '넷앱인사이트2015' 현장에서 소개된 미국 워싱턴주의 한 도시인 '킹카운티'의 아마존웹서비스(AWS) 도입사례는 이런 통념을 뒤바꾼다. 킹카운티는 용량대비 가격과 안정성을 위해 선택했던 테이프스토리지가 더 이상 효율적인 수단이 아니라 판단, 카운티의 자료보존 인프라를 AWS로 전환했다.

킹카운티는 미국에서 13번째로 큰 워싱턴주내 최대 카운티로, 추정 거주 인구는 200만명 가량이다. 경기도 수원, 고양, 성남, 용인시 2배쯤이며 한국 광역시 중 대구보다는 작고 대전과 광주보다는 크다. 관내 법원, 경찰, 교통, 보건, 선거, 공원 등 각종 행정 및 시설 담당 기관 17곳에서 직원 1만5천명이 일한다.

비교적 대도시인 킹카운티의 공공기록 인프라는 어떻게 구성돼 있을까. 카운티에서 발생하는 일일 20테라바이트(TB) 상당의 데이터를 자체 보유한 시스템이 아니라 AWS 퍼블릭클라우드 영역에 쏟아붓고 있다는 점은 인상적이다.

"넷앱의 '플렉스포드(FlexPod)' 표준 가상화 환경을 써 왔습니다. 넷앱 스토리지, 시스코의 네트워크 장비, 마이크로소프트(MS)의 하이퍼V 기반 가상화 시스템을 결합한 통합시스템인데요. 이 장비를 통해 매일 20TB 규모 데이터를 백업하고 있습니다."

IT담당자인 밥 미첼리(Bob Micelli) 매니저가 설명한 카운티 관내 데이터 처리 인프라는 이렇게 요약됐다. 기존 공공기록 자료보존 방식은 여기에 전통적인 백업 소프트웨어를 연결한 뒤 최종적으로 테이프라이브러리에 넘겨 물리적인 형태로 보관하는 것이다.

미국 워싱턴주 킹카운티의 밥 미첼리 엔터프라이즈테크놀로지서비스 디렉터. 지난주 미국 라스베이거스에서 진행된 넷앱인사이트2015 2일차 행사장에서 카운티의 공공기록 아카이빙시스템 전환 사례를 공개했다. (사진: 리처드 트레드웨이 넷앱 클라우드 마케팅 디렉터)

"이전에는 플렉스포드 장비로 모은 데이터를, '비암(Veeam)'의 가상화 기반 백업 솔루션과 EMC의 '데이터도메인' 아카이브솔루션을 거쳐 테이프라이브러리 시스템에 보관했습니다. 최종적으로 암호화 데이터를 담은 테이프 카트리지는, 사람 손으로 차에 실어서 다른 지역에 날랐지요."

이렇게 하는 데 드는 비용이 만만치 않았다. 이런저런 불편도 감수해야 했다.

"연간 테이프(카트리지) 2천개를 썼어요. 쓴 테이프는 상자에 담아 차에 싣고 다른 곳으로 보내는데, 거기 저장된 기록이 필요하면 그걸 다시 가져와야 했죠. 가끔 잼(마그네틱선이 기계에 걸리는 고장)도 생겼어요. 정기적으로 캘리브레이션(정비)도 필요했죠. 연간 300만달러(약 33억7천만원)씩 들었죠."

보존할 데이터가 '폭발적으로' 증가하면서 테이프라이브러리 백업 방식에 제약이 커졌다.

"관련 법령에 따라 저희는 모든 재판 기록이나 법률 관련 문건을 96년동안 보관해야 합니다. 지난 1938년부터 보존하던 자료를 어딘가에 안전하게 저장해야 하는 거죠. 그런데 저장용량에 제약이 생겼어요. 어느 날은 천연자원 담당 부서에서만 70TB 용량을 요청하더군요."

공공기관에서 다뤄야 하는 데이터가 일반 문서뿐아니라 덩치가 큰 음성과 영상 등 멀티미디어까지 확대된 탓이다. 소방서, 경찰서의 신고 접수 녹취를 저장한다든지, 관내 치안용 감시카메라로 녹화한 영상이라든지, 이밖에 다양한 재판 관련 증거 등 장기간 보존을 요하는 기록의 형태는 다양화 추세다.

킹카운티에선 공공기록 아카이빙을 위해 좀 더 저렴한 아키텍처를 도입하기로 했다.

"플렉스포드 기반 데이터 취합 영역을 유지하면서, (아카이빙을 위한) 테이프라이브러리를 없앴습니다. 비암의 솔루션으로 모은 데이터를 EMC 데이터도메인이 아니라 넷앱의 '알타볼트' 백업어플라이언스에 넘긴 뒤, 암호화된 상태로 AWS에 저장하는 형태로요. 이 때 '글레이셔'라는 저장공간을 활용합니다.

미첼리 매니저는 이후 카운티에서 상당한 예산 절감 효과를 얻었다고 자랑했다.

"카운티 예산 중 관련 솔루션 가격을 지난 5년간 43% 절감했고, 전체 인프라 비용도 70% 줄였죠. 연간 30만달러씩 절감하고 있습니다. 총소유비용(TCO) 기준으로 올해만 100만달러를 아꼈어요."

비용 문제를 차치하고도 얻은 게 많다는 설명이 이어졌다.

"압축률이 인상적이었어요. 일반 레코드나 워드 문서뿐 아니라 이미지와 다른 기록들을 저장하는 데 10대 1 비율로 압축되더군요. 또 테이프 관련 수작업이 완전히 필요 없어졌어요. 담당 인력들이 일일이 투입돼야 했던 절차가 이제는 완전히 자동화 방식으로 바뀌었죠. 오류율이 84% 감소했습니다."

이 사례에선 넷앱의 플렉스포드와 함께 돌아가는 백업어플라이언스, 알타볼트와 AWS간의 연동을 통한 혜택이 부각된 경향이 짙다. 킹카운티와 비슷한 효과를 보려면 AWS 클라우드스토리지와 넷앱 알타볼트 솔루션을 함께 써야 할 것이란 얘기다.

"주요 공공기록을 클라우드에 저장할 때 엄격한 규제요건이 따라붙죠. 자체 데이터센터에 구축된 인프라에서 일정 용량으로 데이터를 중간 보존하고, 암호화도 해야 하고, 클라우드에서도 이를 유지하고, 암호화키 관리는 또 설치형 인프라에서 해야 한다든지… 알타볼트가 이런 요건을 충족합니다."

퍼블릭클라우드 저장공간을 반드시 AWS 스토리지로 선택해야 하는 건 아니다.

"알타볼트 솔루션은 관리 인프라의 유연성을 제공합니다. 퍼블릭클라우드로 AWS 환경만이 아니라 마이크로소프트(MS)의 애저까지 관리할 수 있어요. 이 업체들의 지원을 직접 받거나 중요한 소프트웨어 솔루션 지원도 기대할 수 있습니다."

킹카운티가 테이프라이브러리 아카이빙 시스템을 알타볼트와 AWS 퍼블릭클라우드 스토리지로 전환하는 데 소요된 기간은 구체적으로 제시되지 않았다. 미첼리 매니저는 다만 비슷한 신기술 도입을 고려할만한 조직의 담당자들에게 이런 조언을 남겼다.

"이런 기술을 채택하려면 개념검증(PoC) 먼저 하고, 각 기능별 소규모 프로젝트로 시작하세요. 암호화가 정상적으로 이뤄지는지, 데이터 전송 부분에 문제가 없는지 확인하면서요. 또 사업자와 대화해 신기술이 관련 법규에 대응하는지 검토하고, 별도 충족 요건에 대해선 그들에게 알리세요."

관련기사

이후 관련 업무를 맡던 구성원들이 달라지는 업무 방식의 변화에 동조할 수 있도록 독려하는 과정의 필요성도 언급됐다. 의사결정권자의 독단적 의사결정이 아니라 설득을 통해 업무분장과 관리 체계의 변화를 받아들일 수 있도록 유도하는 게 새로운 시스템의 정착을 돕는 요소 중 하나란 설명이다.

"조직 관리 측면에선, IT담당 직원과 실수요자들에 변화가 주어진다는 점과 그 필요성을 충분히 설명해 줘야 합니다. 실질적인 자료를 근거로, 구성원들에게 조직적 차원의 사정을 알려야 합니다. 그 변화에 동참할 수 있도록 말이지요. 이렇게 점진적으로 시작하면 나중에 속도를 더할 수 있어요."