인텔 "AI 기술 테스트 환경 빌려드립니다"

도쿄지사에 최신 인텔HW·SW로 30테라플롭스 인프라 구성

컴퓨팅입력 :2017/04/13 16:05    수정: 2017/04/13 19:05

인텔이 인공지능(AI) 기술 테스트용 자체 데이터센터 인프라를 마련했다. 일반 기업에 공급할 목적으로 완제품 인프라 시스템이나 서비스를 제공하지 않는 인텔이 직접 데이터센터 설비를 갖추고 운영하는 일은 이례적이다.

인텔이 마련한 AI 테스트용 인프라는 일본 도쿄 인텔재팬 사무실 안에 구축된 '인텔재팬 데이터센터(DC) 센터오브엑설런스(CoE)'다. 인텔재팬은 지난 7일 일본 도쿄 사무실에 방문한 한국, 대만, 일본, 호주 IT전문매체를 상대로 CoE를 소개했다. 인텔재팬 데이터센터그룹(DSG) 및 비휘발성메모리솔루션그룹(NSG)의 지역애플리케이션매니저(RAM)인 나호 마치다 매니저가 설명을 맡았다.

일본 도쿄 인텔재팬 사무실에 위치한 인텔재팬데이터센터 센터오브엑설런스(DC CoE) 인프라 장비.

AI 애플리케이션 구동에는 새로운 유형의 데이터센터 인프라 기술이 필요하다. 기업은 활용 가능성이 불확실한 AI용 인프라 기술 투자를 선뜻 결정하기 어렵다. 인텔은 그래서 기업이 투자에 앞서 인텔 AI 기술 활용 가능성을 검토할 수 있도록 CoE를 마련했다는 입장이다.

마치다 매니저의 설명에 따르면 CoE의 인프라는 인텔 AI 기술 기반의 애플리케이션 테스트를 위해 고객사들에게 제공된다. 여러 오픈소스SW, 인텔SW 및 아키텍처와 파트너의 하드웨어 기술이 결합돼 만들어졌다. 인텔 기술로 AI 애플리케이션을 만든 고객사들이 그 성능을 시험해 볼 목적으로 활용할 수 있다.

인텔재팬 DSG/NSG RAM 나호 마치다 매니저

현재 CoE가 제공하는 사항은 6가지다. 첫째, 인텔하드웨어 기반의 고객 애플리케이션 평가, 실험, 최적화. 둘째, 고객 개념증명(PoC). 셋째, 옴니패스 네트워킹 패브릭 연결 실험. 넷째, 데이터센터관리(DCM), 캐시가속SW(CAS)같은 데이터센터 SW 애플리케이션 평가. 다섯째, 벤치마킹. 여섯째, 디버깅.

향후 CoE에 제공될 사항은 4가지다. 첫째, 아파치 스파크 기반 빅데이터분석 테스트 환경. 둘째, 인지분석 AI 프레임워크 사프론. 셋째, 인텔하드웨어 기반의 고객 애플리케이션 평가, 실험, 최적화 대상 확대. 넷째, 경쟁분석(Competitive Analysis).

인텔재팬 DSG/NSG RAM 나호 마치다 매니저

CoE는 인텔 제온E5 v4 프로세서 노드 32대, 부팅 가능한 제온파이 프로세서 노드 8대, 옴니패스 기술을 통한 노드 연결, 제온 노드에 가속용으로 탑재된 PCIe 확장형 인텔 솔리드스테이트드라이브(SSD) 등 하드웨어로 구성된 인프라를 제공한다. 모든 노드는 10G 및 1G 이더넷 스위치, 옴니패스 스위치를 통해 러스터(Lustre) 오브젝트스토리지타깃(OST)과 관리서버에 연결된다.

마치다 매니저는 CoE 인프라 소개 자료를 통해 "최신 인텔 기술과 하드웨어 기반으로 온전히 인텔이 지원하는 보안 환경 안에서 고객사의 애플리케이션을 평가하고 테스트할 수 있다"면서 "초기 제공되는 연산 성능은 초당 30테라플롭스(TFLOPS, 초당 1조회 연산)이며 근시일내 더 높은 성능을 낼 수 있을 것"이라고 예고했다.

일본 도쿄 인텔재팬 사무실에 위치한 인텔재팬데이터센터 센터오브엑설런스(DC CoE) 인프라 장비.

인텔은 제공 성능 향상을 위해 CoE에 출시를 앞둔 주요 하드웨어 제품이 내년이후 적용될 것이라고 밝혔다. 차세대 제온과 제온파이 프로세서, 아리아10 기반 독립형(Discrete) FPGA 가속칩, 제온과 결합된 FPGA 가속칩이 적용될 예정이다. 기존 NVMe 기반 SSD에 더해 차세대 SSD와 옵테인SSD도 탑재된다. 차세대 옴니패스 스위치와 HFI카드도 탑재된다.

관련기사

인프라 성능을 최대한 끌어낼 수 있는 SW 솔루션과 오픈소스 툴도 나올 예정이다. 현재 카페(Caffe)와 테아노(theano) 프레임워크가 지원된다. 텔레메트리 프레임워크 스냅(Snap)과 아파치 스파크 '머신러닝라이브러리(MLlib)' 및 스파크의 딥러닝라이브러리 '빅DL(Big)'도 된다. 사프론은 2018년중 지원 예정이다. 현재 인텔 데이터센터SW인 DCM과 CAS가 지원되고, 향후 랙스케일디자인(RSD) 대응이 추가된다.

마치다 매니저는 "인텔재팬의 DC CoE는 인텔의 데이터센터 고객을 위한 최신 기술 기반으로 최상의 실험, 연구, 지원, 교육 환경을 온전한 인텔 지원 기반의 보안 환경에서 제공한다"며 "AI와 머신러닝 기술을 포함한 고객들의 최신 인텔아키텍처 기반 애플리케이션 테스트를 위해 2개월전 개소했으며 언론에 공개된 건 처음"이라고 강조했다.