크리테오, 머신러닝 연구 지원 위해 대용량 데이터 공개

컴퓨팅입력 :2015/06/24 10:55

황치규 기자

개인화 디스플레이 광고 업체인 크리테오(한국지사 대표 고시나)가 인공지능의 일종인 머신러닝(machine learning) 알고리즘 혁신과 관련 연구 지원을 위해 1테라바이트(terabyte) 규모의 데이터셋(dataset)을 오픈소스 커뮤니티에 제공한다고 24일 발표했다.

크리테오는 학계와 업계에서 머신러닝에 대한 실증적인 연구를 위한 대량 데이터가 보다 많이 공개되는 것을 원하고 있다는 점에 착안해 자사 퍼포먼스 디스플레이 광고 집행 시 발생한 수백만 건의 클릭 피드백으로 구성된 대규모 데이터셋을 공개키로 했다고 설명했다. 또 실제 애플리케이션에서 추출된 데이터셋을 기반으로 관련 전문가들은 머신러닝 플랫폼을 테스트하고 개선 및 발전시켜 나갈 수 있을 것이라고 덧붙였다.

크리테오 데이터셋은 마이크로소프트 애저 클라우드 플랫폼을 통해 공개됐으며, 데이터셋 접속 및 활용 방법은 크리테오랩에서 확인 가능하다. 카네기멜론대학 연구원들이 고속 대량(High throughput) CTR(click-through-rate: 광고클릭률) 측정을 위한 러닝머신 알고리즘 확장성을 테스트하기 위해 이번 데이터셋을 사용했으며, 향후 보다 많은 학계 및 리서치 애플리케이션 전문자들이 활용할 것으로 예상된다고 회사측은 설명했다.

크리테오는 앞으로도 머신러닝 분야 학계 연구 및 업계 기술 개발을 적극 지원해나갈 계획이다. 크리테오는 독자적인 알고리즘을 활용해 개인별 맞춤형 퍼포먼스 디스플레이 광고를 제공하고, 소비자가 특정 광고를 누를 때를 예측하는 플랫폼을 주특기로 하는 회사다.

관련기사