요약
최근 인공 지능(AI) 관련 기술의 발전으로, 다양한 개인 모니터링 장치에 의해 획득된 미세 먼지 데이터는 장래의 미세 먼지 농도를 예측하고 사람들에게 잠재적 위험을 경고하기 위한 트레이닝 데이터로서 가치가 있다. 그러나 이러한 장치들에서 얻은 미세 먼지 데이터의 대부분에는 센서 오작동, 전송 오류 또는 저장 오류와 같은 다양한 요인으로 인해 누락(결측)되거나 비정상적인 이상 데이터가 포함된다. 본 발명에서는 PM2.5 시계열 데이터에서 누락된 데이터를 보간하고 이상 여부를 탐지하는 방법을 제안한다. PM2.5 모니터링 데이터를 사용하여 기존 방법과의 비교 성능을 검증하였으며, 본 발명에서 제안된 보간법이 대부분의 기존 방법보다 RMSE(Root Mean Squared Error)에서 25% 이상의 개선된 결과를 보여주었고, 제안된 이상 감지 방법은 불규칙하고 급변하는 미세 먼지 데이터의 경우에도 상당히 정확한 결과를 나타낸다. 따라서, 본 발명의 제안된 방법은 데이터의 신뢰성 향상에 크게 기여할 것으로 기대된다.