세계 톱5급 AI 슈퍼컴퓨터 등장, 의미는?

[마이크로소프트 빌드2020 돌아보기] ⑤ 인공지능

컴퓨팅입력 :2020/06/05 14:03    수정: 2020/06/05 15:44

마이크로소프트가 세계 5위에 해당하는 인공지능(AI) 슈퍼컴퓨터를 애저 클라우드에 구축했다. 비영리 연구단체 오픈AI에 독점 제공하는 고성능의 슈퍼컴퓨터지만, AI 개발을 지원하는 다양한 모델과 도구가 만들어져 오픈소스와 클라우드 서비스로 공유될 예정이다.

마이크로소프트는 지난달 19일 온라인으로 개최된 연례개발자 컨퍼런스 '빌드2020'에서 '애저 AI 슈퍼컴퓨터'를 개발했다고 발표했다.

케빈 스콧 마이크로소프트 최고기술책임자(CTO)는 20일 기조연설에서 "자연어처리, 컴퓨터비전 등에서 한번에 100가지 흥미로운 것을 할 수 있게 한다"며 "이런 지각 영역의 결합을 보기시작해, 지금은 상상조차 하기 힘든 새로운 애플리케이션을 갖게 될 것"이라고 밝혔다.

■ 여러 일을 함께 수행할 수 있는 거대한 AI

이 슈퍼컴퓨터는 작년 마이크로소프트와 오픈AI 간 협약에 따라 만들어졌다. 마이크로소프트는 작년 7월 오픈AI에 10억달러를 투자한다고 발표했다. 오픈AI는 일론 머스크 테슬라 최고경영자(CEO), 샘 알트만 와이콤비네이터 전 회장 등이 공동 투자해 설립된 AI 기술 연구단체다. 당시 마이크로소프트와 오픈AI는 애저 기반 AI 슈퍼컴퓨터 기술을 구축해 독점 이용하겠다고 밝혔었다.

올해 발표된 마이크로소프트의 애저 AI 슈퍼컴퓨터에 대해 톱500 슈퍼컴퓨터 순위에 올라온 5위급 성능을 제공한다고 설명했다. 작년 11월 기준 톱500에서 5위는 미국 텍사스대학교의 어드밴스드컴퓨팅센터 '프론테라'로 HPL기준성능 23페타플롭스, 이론성능(Rpeak) 38페타플롭스다. 참고로 1위는 미국 에너지부산하 오크리지국립연구소의 '서밋'으로 HPL기준성능 148페타플롭스, 이론성능 200페타플롭스 성능을 보유했다.

애저 AI 슈퍼컴퓨터는 28만5천 이상의 CPU 코어를 가지며, 1만 GPU가 400Gbps 네트워크로 연결된다. 애저 상에서 운영되고 여러 애저 서비스에 접근한다.

애저 AI 슈퍼컴퓨터는 대규모 분산 AI 모델을 훈련하는데 사용될 예정이다. 머신러닝 연구자들은 소규모의 개별 AI모델보다 단일 대규모 모델이 더 나은 성과를 낼 것으로 보고 있다.

케빈 스콧 마이크로소프트 CTO

그동안 나온 AI모델은 ▲번역 ▲사물인식 ▲이메일 속 핵심 정보 읽기 ▲음성인식 같은 특정한 업무 하나만 수행하도록 만들어져왔다. 마이크로소프트는 하나의 AI모델에서 여러 작업을 다중수행(Multitasking)하는 새 모델을 만들려 한다.

마이크로소프트는 대규모 AI 모델 연구에 많은 투자를 해왔다. 그 성과가 곧 외부에 공유될 전망이다. 마이크로소프트는 그동안 거대한 AI 모델군을 구축해왔다. 이는 마이크로소프트 튜링모델(Turing model)이라 불린다.

튜링모델은 빙, 오피스, 다이나믹스 등 마이크로소프트 제품과 서비스의 언어 이해 역량을 개선하는데 쓰였다. 마이크로소프트는 튜링모델을 공개해 세계에서 가장 널리 쓰이는 AI 자연어 모델로 만들고 싶어한다. 튜링모델은 자연어생성(NLG) 모델이다.

튜링모델은 언어, 문법, 지식, 콘셉트, 문맥 등의 미묘한 차이를 깊이 숙지할 수 있다. 이같은 능력은 하나의 AI 모델이 긴 발화를 요약(summarizing)하거나, 실시간 게임 채팅의 콘텐츠를 조정(moderating)하고, 수천개 법률 서류에서 관련된 부분을 발견(finding)하는 등의 작업을 수행할 수 있다는 얘기다.

빌드2020에서 마이크로소프트는 곧 튜링모델을 오픈소스화 할 것이라고 밝혔다. 애저 머신러닝을 사용해 트레이닝하는 방법도 함께 내놓을 계획이다. 하드웨어와 운영체제를 오가며 이동가능한 모델을 만드는 오픈소스 라이브러리 ONNX 런타임의 분산 트레이닝도 지원할 예정이다.

■ AI 모델 개발 돕는 다양한 툴은 일반에 공개

애저 AI 슈퍼컴퓨터가 오픈AI에 독점으로 제공되는 반면, 그 컴퓨터에서 쓰이는 AI 모델과 학습최적화도구는 애저 AI 서비스와 깃허브를 통해 만들어진다. 다양한 연산 가속기와 서비스가 '애저 AI'에서 사용가능해진다. 슈퍼컴퓨터를 항시 보유하지 않는 고객을 위한 서비스다.

마이크로소프트의 AI 슈퍼컴퓨터 프로젝트는 '오딧세이(Odyssey)'라 불려왔다. 이 프로젝트엔 크레이, HPE, 멜라녹스, 엔비디아 등 다양한 파트너사가 참여하고 있다.

마이크로소프트의 오딧세이 관련 직원채용 공고가 이어지는 가운데, 애저스토리지 팀도 채용 공고를 올렸다. 일반 PC 수만대를 엮어 대규모 병렬 슈퍼컴퓨터 작업을 하는 업무라고 소개됐다. 이는 검색, 광고, 포털 비즈니스 등의 사업에서 발생하는 문제를 해결하기 위한 용도로 보인다. 튜링모델과 오딧세이 프로젝트도 관련될 수 있다.

튜링모델은 마이크로소프트의 '대규모 AI(AI at Scale)'라 불리는 이니셔티브 일부분이다. 대규모 AI의 핵심 전제는 어디서나 재사용 가능한 AI 모델이다. 대형 인공신경망을 고성능 인프라에서 실제로 학습시킬 수 있게 하고, 그 모델을 재사용해 여러 제품에 적용된 AI를 개선하게 쓴다는 것이다.

마이크로소프트는 하나의 언어 이해 모델을 학습시켰고, 이를 튜링NLR로 부른다. 튜링NLR은 빙, 워드, 셰어포인트, 아웃룩 등 복수의 제품에서 채택됐다.

마이크로소프트 이용자는 오픈AI에 제공되는 애저 AI 슈퍼컴퓨터를 직접 사용할 수 없다. 그러나 애저 컴퓨트 인프라의 업그레이드 버전을 사용할 수 있다. 대규모 확장 모델을 학습시키기 위한 '딥시드(DeepSeed)' 오픈소스 소프트웨어와, 더 저렴하면서도 더 빠르게 모델을 구동, 배포할 수 있는 ONNX 런타임도 쓸 수 있다. 독자적으로 모델을 학습시킬 수 없거나, 트레이닝을 하려는 사용자는 튜링모델을 재사용할 수 있고, 향후 튜링NLR도 재사용할 수 있게 된다.

오픈AI는 2015년 '인류를 위한 인공지능'을 표방하는 비영리 연구조직으로 출범했다. 자율주행차 개발 플랫폼 '딥드라이브'나, 여러 AI가 서로 대화하는 언어 연구도 진행했다. 문장을 생성하는 AI플랫폼 GPT-2는 너무 진짜 같은 기사를 스스로 작성해 개발자들을 긴장시켰을 정도다. 작년엔 사전학습없이 AI가 스스로 문제 해법을 찾아가는 실험도 진행했다.

■ 미래의 AI는 플랫폼이어야 한다

애저 AI 슈퍼컴퓨터는 올해 마이크로소프트 빌드2020의 모든 발표를 관통하는 주제다. 올해 마이크로소프트는 빌드 행사를 통해 개발자의 힘을 극대화하고, 더 나은 성과를 내도록 하는 기술에 초점을 맞췄다.

사티아 나델라 CEO는 "오늘날 개발자는 세상을 바꾸고, 코로나19 위기를 돌파하는 최전선에서 일하고 있다"며 "그런 개발자를 돕는 다양한 신기술과 플랫폼을 제공하겠다"고 강조했다.

윈도10은 리눅스 영역의 개발을 전면 지원하기 시작했고, 따로 떨어져있던 Win32 API와 유니버셜윈도플랫폼(UWP)은 '리유니언 프로젝트'를 통해 '윈도 API'로 단일화시켰다. 마이크로소프트 팀즈는 단순 협업도구에서 기업의 언택트 비즈니스를 지원하는 '원격 업무 플랫폼'으로 진화하는 모습을 보여줬다. 로우코드, 노코드 등 소스코드 작성능력 없는 사람이 필요한 기능을 직접 만들 수 있도록 돕는 '파워플랫폼'은 어떤 사람도 개발자가 될 수 있게 한다.

마이크로소프트365 내의 여러 애플리케이션과 서비스는 '그래프API'를 통해 연결되고, 각 콘텐츠와 사람이 네트워크를 이뤄 고도의 협업과 업무 생산성 향상을 추구하게 된다.

그 중심에 AI가 있다. AI는 개발자의 힘을 극대화하고, 비개발자도 상상을 SW로 만들어내도록 돕는다는게 마이크로소프트의 강조점이다.

'기술의 미래'를 주제로 한 케빈 스콧 CTO의 기조연설은 튜링모델로 소프트웨어 코드를 생성하는 모습을 보여줬다.

샘 알트만 오픈AI CEO

케빈 스콧 CTO와 오픈AI의 샘 알트만 CEO는 튜링모델로 할 수 있는 다양한 시나리오 가운데 개발자의 콘셉트를 기반으로 코드를 만들어내는 모습을 시연했다. 이 장면이 올해 빌드의 '결정적 장면'이었다.

두 사람의 대화는 케빗 스콧 CTO 기조연설 영상의 26분째부터 시작된다. 그중 AI 모델에게 소스코드를 생성하게 만드는 시연은 30분 이후부터다.

샘 알트만은 오픈AI의 기술을 이용, 자기가 만들고 싶은 코드의 내용을 사람의 언어로 정의한다. 그럼 곧바로 AI가 소스코드로 작성한다. 수초도 걸리지 않았다.

튜링모델이 개발자의 원하는 명령을 이해하고 소스코드를 작성한 모습. 빨간 네모 안의 붉은 글씨가 샘 알트만이 정의한 요구사항이다. 그 아래의 코드는 AI모델이 작성했다.

이어진 시연은 보스턴다이나믹스에서 튜링모델을 활용해 4족보행로봇에게 피자를 배달시키는 내용이었다.

관련기사

케빈 스콧 CTO는 "AI가 잠재력을 최대한 발휘하려면 플랫폼이어야 하며, 이 플랫폼은 전례 없는 규모로 힘을 공급하고 제공돼야 하며, 모든 사람이 혁신하고 그 위에 구축할 수 있도록 민주적이어야 한다"고 말했다.

그는 "AI의 미래는 그 힘을 활용할 수 있는 개발자의 손에 있을 것이며, 이를 위해 데이터 과학자나 머신 러닝 전문가가 될 필요는 없다"며 "당신이 기술로 달성하고 창조하고자 하는 큰 꿈은 대규모로 AI를 구축하는 것으로 가능해질 것"이라고 강조했다.