"데이터 가두는 문서포맷, 4차산업혁명 걸림돌"

전경헌 사이냅소프트 대표 인터뷰

컴퓨팅입력 :2018/06/19 11:05    수정: 2018/06/26 08:28

"우리가 다루는 정보는 웹에 있거나 데이터베이스(DB)에 있는 게 대부분이다. 나라에서 생산하는 많은 문서가 아래아한글(HWP)로 돼 있다. 데이터가 대부분 이 포맷에 갇혀 있어 활용하기 어렵게 돼 있다. 빅데이터, 인공지능(AI)에 필요한 데이터가. 바꿔야할 때가 됐다."

전경헌 사이냅소프트 대표가 공공부문의 빅데이터와 AI시대에 필요한 데이터 확보를 어렵게하는 주된 요소로 오피스 소프트웨어(SW)와 HWP, PDF, 오피스 등 문서 포맷을 꼽았다. 그는 2000년 회사를 설립해 개발한 기술로 웹사이트 '문서바로보기' 솔루션을 출시한 인물이다. 이 솔루션은 국내 공공기관과 정부 및 지방자치단체에 공급돼, 공공사이트를 찾은 국민의 '노플러그인 문서열람' 환경 구축에 기여했다.

문서바로보기로 열람 가능한 HWP는 공공기관에서 문서를 생산, 배포할 때 쓰는 주 포맷이다. 그런데 공공기관이 특정 기업 제품에 종속된 포맷으로 문서를 생산하고 배포하는 관행은 부당하다는 비판이 오래 전부터 있었다. 내용을 읽고 출력하거나 편집해야할 때 별도 뷰어를 설치하거나 한컴 SW제품을 사서 써야 한다는 점이 문제로 꼽힌다. 이 주제로 현재도 청와대 국민청원이 빈번하게 제기되고 있다.

전경헌 사이냅소프트 대표

사이냅소프트의 문서바로보기 솔루션은 내용을 열람하는 시나리오에 한해 국민의 불편을 일정 정도 해소해 주는 기능을 하고 있다. 하지만 전 대표는 회사의 이해관계를 떠나서 실질적인 국민 불편을 원천 해소하려면 문서를 만들어내고 있는 공공부문의 서식 간소화 같은 업무관행 변화가 절실하다고 봤다. 서식 간소화는 그에 따른 국민 불편이 해소될 뿐아니라 4차산업혁명의 걸림돌도 걷힐 것임을 시사했다.

지난 15일 서울 구로디지털단지 사이냅소프트 사무실에서 만난 전 대표와의 인터뷰를 아래 1문1답으로 정리했다.

- 청와대 국민청원 게시판에 한글 문서 배포를 지적하는 청원이 빈번하게 올라오던데, 본 적 있나

"사이트에 들어가 검색해 봤다. 불편을 느끼는 사람이 많다. 전국민에게 영향을 주는 사안이기 때문에, 기술 관련 이슈지만 '마이너'하지는 않다고 생각한다. 어떤 청원은 수천건도 넘게 동의가 달렸더라. 그 중에는 단순 '동의합니다' 말고 장문의 의견을 남긴 동의 의견도 있었다. 읽어 보니 어떻게 바뀌어야 할지는 거기 정답이 다 있었다. 아직 그런 쪽으로 달라지지는 않고 있는 것 같다."

- 어떤 국민들의 불만은 주된 공공문서 포맷이 한컴 독점인 HWP라서인 것 같은데, 다른 포맷이면 괜찮을까

"아래아한글이 아니라 다른 문서 포맷, MS오피스나 PDF로 바꾸더라도 불만이 없어지진 않을 거다. SW패키지 제품을 구입한다고 칠 때 한컴오피스보다 MS오피스가 더 비싸다. PDF는 포맷을 볼 수 있는 수단은 많지만 열람하는 것 외에 편집 등 활용하는 데 제약이 있다. 오픈소스SW 제품인 '리브레오피스'같은 걸 쓴다는 접근도 고려할 수 있겠지만, 상용SW 제품 대비 원활하게 쓰기는 훨씬 불편할 거다."

- 공공 사이트에 방문시 불편은 사이냅소프트의 기술을 적용한 환경에서 일정정도 해소되지 않나

"우리 기술을 쓰면 내용을 열람할 수 있지만, 문서에 데이터가 갇혔다는 점은 그대로다. 빅데이터, AI에 활용을 못한다. (데이터가 중요하다는) 4차산업혁명 얘기 많이들 하잖나. 그런데 나라에서 생산하는 거의 모든 문서는 몇 가지 전용 포맷으로 돼 있다. 그건 포맷에 (정보가) 갇힌 셈이다. 정작 우리가 다루는 정보 대부분은 아래아한글이나 MS오피스가 아니라 웹과 DB에 있다. 이런 상황을 바꿀 때가 됐다."

- 공공문서 생산방식이나 관행에서 뭐가 어떻게 바뀌어야 할까

"공공문서는 활용하는 서식이나 서체에 특이한 게 많다. 그때문에 동일한 포맷 문서라도 어떤 오피스SW나 뷰어를 쓰느냐에 따라 시각적인 결과가 달라진다. 호환이 잘 안 되는 것처럼 보이는 이유다. 정부와 공공기관에서 해야 할 일은 일단 (문서바로보기처럼) 애플리케이션이 없어도 내용을 볼 수 있게 하는 방식을 제공하는 것도 있지만, 다른 하나는 이런 특이한 문서 서식을 줄이는 방향으로 간소화하는 것이다."

- 서식 간소화라면, 공공기관에서 추진해 온 '문서간소화'와는 다른 개념인가

"문서간소화는 예를 들어 어떤 행정업무 처리할 때 요구했던 서류가 10종이었다면, 3종만 내게 하자는 개념이었다. 이제 개별 문서의 형태 자체를 간소화해야 한다. 문서에 삽입하는 표 안에 표를 또 집어넣는다든지, 바깥 테두리선을 그린다든지, 다단 편집이라든지, 장식적인 체크박스라든지, 그런 요소를 빼서 공공 문서를 간소화해야 한다. 그러면 일단 여러 오피스SW가 호환 문제 없이 그 문서로 작업할 수 있다."

- 최종적으로 호환성을 높이면 되는 건가

"지금 우리 제품을 쓰면 '보는 것'의 불편은 충분히 해소할 수 있고, 서식을 간소화하면 '편집'과 '제출'시 오피스SW의 호환성 문제를 덜어낼 수 있다. 어떤 문서는 아예 서식 없는 형태로 바꿀 수 있겠다. 예비군훈련통보서같은 문서를, 굳이 아래아한글 포맷에 표 그려서 채워넣을 필요가 있을까. 웹문서로 텍스트만 입력, 표시하면 충분하다. 이렇게 불필요한 행정서식을 없애는 '위원회'가 만들어져야지 않을까 싶다."

관련기사

- HWP 포맷과 이를 만든 한컴 쪽에 변화를 바란다면

"한컴이 HWP 포맷을 더 적극적으로 공개해야 한다. 한컴2018 제품이 나온지 6개월 됐지만 그 신기능은 아직 포맷 규격 내용에 반영되지 않았다. 규격 내용도 구체적이지 않아 추측해서 구현해야 하는 부분이 꽤 있다. 그리고 HWP 포맷 형태가 바이너리와 XML 등 여러가지인데, XML를 더 적극적으로 써야 한다. 이상적인 모습은 정부에 HWP 포맷을 기증하고 그걸 개정한 다음 그에 맞춰 SW를 개발하는 거다."