교통 분야 공공 데이터는 ‘데이터 수집의 용이성’ ‘정보 공유의 용이성’ ‘반복성과 대표성’ ‘인과관계보다 현 상황에 대한 이해 위주’ 등의 이유로 수집과 분석이 상당히 쉬운 데이터로 분류됐다. 그러나 최근 빅데이터 분석을 위한 데이터 통합과 ‘예측’에 대한 니즈가 커지면서 문제점이 나타나기 시작했다. 이렇게 나타난 문제점을 정책적으로 해결하기만 한다면 교통 분야 빅데이터는 공공정책 분야는 물론 민간 비즈니스 영역에서도 큰 가치를 창출할 수 있다. 서울시 심야버스, 영국과 싱가포르의 교통 정책 등 이미 성공 사례가 존재하며, 미국에서는 민간 교통정보 업체가 정책과 비즈니스에 도움을 주는 새로운 가치를 창출하고 있다. 교통 정보 데이터는 단순히 교통 당국과 교통수단 이용자만이 아니라 전혀 다른 영역의 비즈니스에서도 활용될 수 있다.
미국의 실업률 증가는누가 가장 먼저 예측했을까?
2011년, 금융위기를 넘기면서 점차 회복되던 미국의 경제가 주춤하기 시작했다. 물론 정치인들은 이를 부정하고 있었다. 당연히 정부가 발표하는 수치에도 실업률 증가 추세는 나타나지 않았다. 하지만 미국의 여러 자동차회사로부터 운행 중 차량 데이터를 얻어 이를 종합하고 가공하는 민간 교통정보 업체가 이를 정확하게 잡아냈다. 러시아워에 길이 덜 붐빈다는 걸 보고 ‘실업률 증가 가능성’을 제기했다. 그리고 몇 달 뒤 이는 사실로 드러났다.11이와 관련한 내용은 『빅데이터가 만드는 세상(2013, 21세기북스, 빅토르 마이어 쇤버거·케네스 쿠키어 지음/이지연 옮김)』을 참고했음.
닫기
실제 사람들이 실업 상태에 들어가면 실업수당을 신청하고 새로운 직장을 알아보면서 지역과 중앙정부 산하의 기관에 접촉하기 전 한두 달 휴식을 취하는 경우가 많다. 그런데 이런 휴식 기간은 공식 실업률 통계에 전혀 반영되지 않는다. 교통정보 업체는 러시아워 시간대의 교통정보를 보고 실업률 증가를 거의 실시간으로 예측했지만 정부 공식 통계로 나타나기 전까지 시차가 있던 셈이다. 이렇듯 교통 정보를 교통에만 국한된 정보로 보지 않고 다른 관점에서 접근하면 새로운 통찰을 얻을 수 있다. 실제 미국 실업률 증가를 예측했던 기업 인릭스(Inrix)는 교통정보를 활용해 지역 경제의 건강을 측정하기도 한다. 이 업체의 데이터를 통해 소매 업체의 판매실적이나 레저활동의 패턴 등을 읽을 수 있다. 이번 호에서는 이처럼 다양한 영역에서 활용할 수 있는 ‘전통의 빅데이터’ 교통 정보의 데이터 특성에 대해 알아보고, 정책과 비즈니스 영역에서의 활용 사례, 그리고 정책과 비즈니스가 맞물리는 지점에 대해 설명하고자 한다.
교통정보의 특성: 일기예보와 교통 예측
우리는 뉴스를 통해 어떤 사건이 발생했는지를 알게 된다. 뉴스의 대부분은 당일 혹은 전일에 발생한 다양한 사건을 종합해 시청자에게 제공한다. 그런데 이렇게 제공하는 정보 중 일기예보와 교통정보는 일반적인 뉴스와 약간 이질적인 면이 있다. 우선 뉴스가 과거의 정보를 제공하는 데 비해 일기예보는 미래의 가능성을 제공한다. 이런 측면에서 일기예보는 ‘시점의 이질성’을 갖고 있다. 또 뉴스가 제공하는 정보는 사건 발생 직후부터 짧게는 수 시간에서 길게는 하루 이상 유효한 데 비해 교통정보는 1시간만 지나도 그 정보의 효용성이 떨어진다. 따라서 교통정보는 ‘정보 유효 시간의 이질성’도 지니고 있다. 그뿐만 아니라 이 두 정보는 매일 반복되기 때문에 사람들이 어느 정도 예측할 수 있지만 매일 다른 상황이 발생한다는 특징도 있다. 특히 교통정보는 정보 제공 후의 짧은 유효 시간 내에 정보 이용자의 의사결정을 바꿀 수 있기 때문에 예상하지 못한 새로운 상황을 유발하기도 한다.
일기예보 및 교통정보는 매일 반복된다는 특성을 갖고 있기 때문에 과거 데이터와 인공지능을 활용해 예측 정확성을 높이려는 시도가 이어지고 있다. 하지만 일기예보는 인공지능이 활용하는 방법론(과거 데이터를 기반으로 미래를 예측)의 정확도가 수치예보모델22 현재 기상을 예측하기 위해 활용하는 방법론. 대기의 운동을 보여주는 방정식에, 기상에 영향을 주는 기온·바람·대기 중의 수증기 양을 넣고 계산하면 미래의 기상변화를 보여준다는 모형
닫기보다 높지 않아 아직까지는 유의미한 성과를 내지 못하고 있다. 물론 꽃가루 고농도일 예측과 같은 일부 영역에서는 인공지능을 활용한 예측이 이뤄지고 있다. 하지만 기상 분야는 수치예보모델의 예측 정확성 향상이 우선 과제다. 인공지능은 수치예보모델의 예측 결과를 예보관이 해석할 때의 오류를 줄이기 위해 보조적으로 활용하는 방향으로 발전하고 있다.