“구글도 잘 못 찾는 공공문서, 서치퍼트가 찾아준다”

214곳 공공기관 ·정부부처 500만 건 문서 제공

인터넷입력 :2019/11/06 16:48    수정: 2019/11/06 23:27

문화체육관광부, 국토교통부, 환경부 등 국내 정부기관 웹사이트에는 정보공개제도에 따라 다양한 공공정보와 정부의 주요정책들이 올라온다. 이를 통해 기업이나 시민들은 정부 기관이 어떤 정책을 추진하는지, 또 어떤 서비스들을 제공하는지 파악할 수 있다.

하지만 네이버, 구글 등 검색포털 사이트에서는 이런 정부 기관들의 문서가 잘 검색되지 않는다. 이 때문에 맛집이나 여행지 등은 일반 검색포털이 유용하지만, 문서 검색 영역에서는 네이버, 구글도 구멍가게 수준이다.

이 틈새시장을 겨냥한 스타트업이 바로 서치퍼트(대표 노범석)다. 공공정보가 누구에게나 개방된 만큼 쉽게 접근할 수 있어야 하는데 그러지 못한 문제를 해결하겠다는 것이 이 회사가 풀고자 하는 미션이다. 서치퍼트는 200개 정도의 공공서비스 문서들을 가져와 직관적으로 보여준다. 이를 통해 문서 검색에 필요한 시간을 크게 줄여준다.

서치퍼트 노범석 대표.

문서검색 포털기업 서치퍼트는 6일 기자간담회를 열고 서비스 소개 및 비전 발표 자리를 가졌다. 이번 간담회에는 노범석 대표를 비롯해 유병우 개발본부장, 박준 연구소장 등이 참석했다. 서치퍼트는 약 7개월 간의 베타 서비스 기간을 거쳐 지난 10월 16일 정식 출시됐다.

노범석 대표는 "서치퍼트는 국내 최초로 문서검색 포털 서비스를 표방한다. 문서 데이터의 양이 점점 방대해지고, 특정 문서의 경우 검색에 제한적일 수도 있다"며 "서치퍼트는 일을 효율적으로 하고자 하는 전문가들의 업무 능력을 획기적으로 향상시킬 수 있을 것"이라고 말했다.

실제 서치퍼트는 대법원, 감사원, 국세청 등 214곳의 공공기관 및 정부부처 등을 대상으로 500만 건(약 1억 5천만 페이지)의 문서를 제공하고 있다. 이는 약 6테라바이트(Tera Byte)에 해당하는 규모다. 문서 데이터로는 국내 최대 규모다.

서치퍼트는 입법, 법무, 준법, 세무, 기업공시, 정책연구, 선거와 정당, 대통령위원회, 공정거래, 중소벤처 등 카테고리를 데이터 세트로 구분해 문서를 제공한다. 일례로 입법정보는 16대 이후 국회에서 발행된 모든 문서를 포함하고 있으며, 중앙정부는 각 부처에서 발행한 최초일부터 최근일까지 모든 문서를 제공한다. 기업공시는 2009년 이후 기업 공시 전체 데이터를 선보인다.

노범석 대표는 "각 분야의 전문가들이 정확한 정보를 찾고 관리하는 것이 경쟁력인 시대에 서치퍼트에 대한 시장의 반응이 좋다"며 "최근 대기업, 대학 등 관계자들도 서비스에 대한 문의가 있다"고 강조했다.

문서 저작권 이슈에 대해서 노 대표는 "서치퍼트는 출처가 명확하고 공개가 허용된 문서를 대상으로 제공하고 있으며, 내년에는 미국 정부 및 UN 관련 문서도 제공할 계획"이라고 밝혔다.

서치퍼트가 보유한 문서 빅데이터를 연구 목적으로 활용하고자 하는 대학 및 연구소, 기업 등에 무상 제공 계획도 밝혔다.

박준 소장은 "서치퍼트의 문서 빅데이터를 무상 제공하게 되면 대용량의 비정형 데이터 문서 수집 비용을 절감할 수 있어 국내 인공지능 연구의 활성화를 기대할 수 있다"면서 "AI 기반 한글 자연어 처리를 위한 데이터 활용이 보다 폭넓게 적용 될 것"이라고 말했다.

서처퍼트는 문서검색 서비스뿐 아니라 문서모니터링, 자기문서검색, 절판도서 거래 서비스 등으로 서비스 영역을 확대할 방침이다. 나아가 전세계 오픈소스를 끌어와 미국 등 해외 시장 진출 계획도 있다. 이 회사는 현재 7억원 정도의 엔젤 투자를 받았다. 가까운 시일 내로 기관투자를 위한 홍보활동(IR)을 진행할 예정이다. 이를 통해 문서 검색 서비스를 고도화 하고, 해외 서비스도 준비한다는 방침이다.

서치퍼트와 같은 공공데이터 문서 검색 사업을 기존 포털사가 뛰어들 가능성은 없냐는 질문에 유병우 개발본부장은 “이런 식의 서비스는 네이버다 다음 같은 거대 포털이 하기에는 세세한 수작업들이 굉장히 많다”며 “기업문화 관점에서 접근하기 어려운 사업”이라고 답했다.

노범석 대표는 “네이버나 다음이 이 시장에 들어와도 경쟁하겠다”면서 “국내 공공 정보를 모으는 데 약 3년이 걸렸는데, 빠른 엑시트보다 좀 더 큰 시장을 보고 좋은 아이디어를 최대한 전세계 이용자들에게 경험시켜보고 싶은 바람이 있다”고 말했다.

관련기사

공공문서 검색 서비스 서치퍼트는 유료로 운영될 계획이다. 베타 기간 동안 20여곳에서 이용했으나, 사용목적이나 범위가 다 제각각이어서 가격 정책은 현재 세우는 중이다. 서치퍼트를 사용하기 좋은 타깃은 변호사나 회계사 같은 전문직이지만, 국가 정책을 꾸준히 파악해야 하는 업무 담당자나 대학에서도 유용하게 쓰일 수 있다.

한편 서치퍼트 노범석 대표는 안진 및 삼일회계법인 등에서 오랫동안 경력을 쌓아 온 회계사 출신으로 게임 회사 창업 이력이 있다. 공동 창업자인 유병우 개발본부장은 엠파스 재직 시절 검색 고도화를 주도한 바 있으며, 기술표준관련 오픈 API 개발 등 개발자로 활동해 왔다. 또 인공지능(AI) 전문가로 경력을 쌓아 온 박준 연구소장은 서치퍼트의 AI 적용 및 고도화에 주력하고 있다.