"미세먼지 빅데이터 분석해보니 중국과 연관성 커"

행안부, UN 글로벌 펄스 자카르타 연구소와 공동 실험

컴퓨팅입력 :2019/01/29 16:53    수정: 2019/01/30 16:37

중국 미세먼지 농도가 국내 미세먼지 농도와 연관성이 크다는 데이터 분석 결과가 나왔다.

행정안전부 국가정보자원관리원은 UN 글로벌 펄스 자카르타 연구소와 업무협약을 체결하고, 동북아 지역의 미세먼지 예측과 주요 요인에 대한 데이터 분석 결과를 29일 공개했다.

이번 분석에서는 국내외 요인을 정확히 파악하기 위하 서해안의 인구 밀집 지역인 인천을 분석 대상으로 선정했다. 이전 수치 예측 모델과 달리 머신러닝을 활용해 다음날 미세먼지 예측 모델을 개발하고, 미세먼지에 영향을 미치는 주요 요인을 파악했다.

이번 분석에는 지난 2015년 1월부터 지난해 3월까지의 데이터를 활용했다. ▲환경부가 제공한 인천 지역 미세먼지, 대기오염 데이터 2만8천464건 ▲미국항공우주국(NASA)에서 제공한 동북아 지역 위성 센서 데이터 ▲에어로넷의 지상 관측 센서 데이터를 활용했다.

NASA 위성 데이터

UN 글로벌 펄스 자카르타 연구소에서는 인도네시아 대기오염 관련 데이터 분석 경험을 바탕으로 기술 자문을 제공했다.

이를 통해 미세먼지 예보 예측도를 높이는 '그래디언트 부스팅' 기반 예측 모델을 구현했다.

해당 모델로 지난해 1분기를 예측한 결과, 미세먼지(PM10) 84.4%, 초미세먼지(PM2.5) 77.8%의 정확도를 보였다. 이전 국내 미세먼지 예보 대비 정확도가 약 15% 높아진 것을 확인한 것.

미세먼지의 주요 예측 변수로는 풍향, 강우량, 서해안과 중국 산둥성 지역의 에어로졸 농도가 도출됐다. 에어로졸은 미세먼지의 일종이다. 초미세먼지의 경우 풍속, 풍향과 중국 내 몽골, 베이징과 허베이성 지역의 에어로졸 농도로 나타났다.

상세 분석 결과, 미세먼지가 '나쁨'일 경우 풍향은 서풍이 불며 산둥성, 산시성, 베이징, 허베이성 등의 중국 지역의 에어로졸 농도가 매우 높다는 것을 확인했다.

특히 인천 20개 관측소의 미세먼지 예측 연관성을 비교한 결과, 인천 도심 지역이 아닌 백령도 지역의 미세먼지와 이산화질소(NO2)가 가장 높은 연관성을 보였다.

이는 국내 요인보다 국외 요인이 상대적으로 높음을 보여주는 결과다.

데이터에서 국외 요인을 제거 후 지난해 1분기를 예측한 결과, '좋음' 등급에 해당하는 날은 20일에서 30일로 50%나 증가하는 것으로 나타났다.

관련기사

향후 국가정보자원관리원은 보다 정확한 예측을 위해 에어로졸 분석 성능이 뛰어난 국내 정지 위성 '천리안 2A·2B'의 데이터를 추가 확보하고, 다른 분석 모델과의 결합을 통해 예측 정확도를 높인다는 계획이다.

김명희 행정안전부 국가정보자원관리원장은 “이번 분석은 국민의 생존권과 직결되는 미세먼지 문제를 빅데이터로 접근한 아주 의미있는 사례”라며 “향후에도 재난, 안전 등 사회적 가치가 높은 분석 과제를 지속적으로 수행해 정부 정책에 대한 국민의 신뢰를 얻고 국민의 삶이 개선되도록 노력할 계획”이라고 밝혔다.