메타, 오픈소스 모델 '라마3' 출시…페북-인스타 등에 적용

비영어권 데이터셋 5%…답변 편향 방지 도구 업데이트도 진행

컴퓨팅입력 :2024/04/19 10:41

메타가 오픈소스 생성형 인공지능(AI) 모델 '라마 3'를 출시했다. 라마3는 현재 AI 챗봇서비스 '메타 AI'에 적용됐다.

18일(현지시간) 메타는 자사 블로그를 통해 라마3 시리즈의 자세한 내용을 공개했다. 시리즈는 총 3가지 버전으로 이뤄졌다. 우선 매개변수 80억개와 700억개 버전부터 나왔다. 나머지 버전은 미공개 상태다. 매개변수 4천억개 버전이며 데이터셋 훈련 중이다.

메타 측은 "메타3의 최소형 버전 기능은 라마2 초대형 버전과 비슷한 수준"이라며 "현존하는 오픈소스 모델 중 가장 성능 좋다"고 강조했다. 

메타 라마 3 벤치마크 테스트 결과. (사진=메타 홈페이지)

메타는 다른 모델과 비교한 성능 테스트 결과를 공개했다. 다중작업언어이해(MMLU) 등 AI 벤치마크를 활용했다. 라마3 8B는 9개 벤치마크에서 미스트랄 7B와 구글 제미나이 나노를 넘어섰다. 

특히 라마3 70B는 MMLU에서 79.5점을 받아 구글 제미나이 프로보다 높은 점수를 기록했다. 이 버전은 제미나이뿐 아니라 앤트로픽 클로드3 오퍼스 버전과 맞먹는 점수를 기록했다.

라마3 모델은 아마존웹서비스(AWS)를 비롯한 데이터브릭스, 구글 클라우드, 허깅 페이스, 캐글, IBM의 왓슨X, 마이크로소프트 애저, 엔비디아의 NIM, 스노우플레이크를 포함한 클라우드 플랫폼에서 관리형 형태로 제공될 예정이다. 

라마3, 비영어권 데이터셋 전체 5%…안전 도구 업데이트

메타는 라마3 데이터셋 중 비영어권 데이터 비율이 5% 이상이라고 설명했다. 이 5% 안에 영어를 제외한 30개 언어가 들어갔다.

메타는 라마3 데이터셋 중 비영어권 데이터 비율이 약 5%라고 설명했다. (사진=메타 홈페이지 캡처)

메타 측은 "이번 모델은 라마2보다 더 높은 비영어권 데이터셋으로 이뤄졌다"며 "데이터 다양성이 증가하면 여러 언어에서도 강력한 성능을 발휘할 것"이라고 설명했다.

답변 편향성 감소를 위한 노력도 했다. 메타의 생성형 AI 안전 제품군인 '라마 가드'를 업데이트했다. 보안 취약점을 탐지할 수 있는 도구 '코드 쉴드'도 조만간 출시할 예정이다.  

반면 업계에서는 이런 도구가 답변 필터링을 100% 보장하지 않는다고 반응했다. 라마3 모델이 실제 환경에서 어떻게 작동될지 우선 지켜봐야 할 것이라는 입장이다.

라마3 모델은 아마존웹서비스(AWS)를 비롯한 데이터브릭스, 구글 클라우드, 허깅 페이스, 캐글, IBM의 왓슨X, 마이크로소프트 애저, 엔비디아의 NIM, 스노우플레이크를 포함한 클라우드 플랫폼에서 관리형 형태로 제공될 예정이다.

라마3, 인스타그램·페이스북·왓츠앱 탑재…'메타 AI' 서비스 시작

이날 메타는 자사 소셜미디어 서비스 페이스북과 인스타그램, 왓츠앱에서 메타 AI 서비스를 시작했다. 여기에 라마3 시리즈가 들어갔다. 

메타는 자사 소셜미디어 서비스 페이스북과 인스타그램, 왓츠앱에서 메타 AI 서비스를 시작했다. (사진=메타 홈페이지 캡처)

메타 AI는 이용자 질문에 답변을 제공하거나 이미지 등을 생성할 수 있다. 이용자는 메타 AI에 레스토랑 추천을 요청하고, 휴가를 계획하거나 새 아파트를 장식에 필요한 아이디어를 물어볼 수 있다. 다만 메타 AI의 이미지 생성 기능은 왓츠앱과 웹사이트에서 베타 버전만 제공된다.

현재 미국과 캐나다, 뉴질랜드, 호주 등 12개국 영어권 사용자부터 서비스를 이용할 수 있다. 한국은 1차 서비스 대상이 아니다. 

마크 저커버그 메타 최고경영자(CEO)는 "메타 AI는 가장 지능적인 'AI 비서' 역할을 할 것"이라고 했다.