박지환 변호사 (정보공개센터 운영위원)
프랑스에는 색다른 데이터가 존재한다. 바로 공익데이터다. 2016년 제정된 디지털공화국을 위한 법(디지털공화국법)에 정의된 공익데이터는 민간에서 나온 데이터이지만 공공정책의 수준을 높이기 위해 공개와 공시가 정당화되는 데이터를 말한다. 이번 글에서는 민간과 공공의 이분법을 넘어 공익 목적으로 누구나 제한 없이 쓸 수 있는 데이터를 공익데이터라 칭하겠다.
공익데이터 활용 사례로는, 맛집 평가 플랫폼인 옐프(Yelp) 알고리즘 사례가 있다. 옐프에 이용자들이 올린 평가 데이터를 분석해 보건위생 위해요소가 있는 상점을 사전에 판단하는 알고리즘을 만들어낸 것이다. 실제로 보건당국이 해당 상점에 대해 선제 조사 또는 조치를 해서 보건행정 효율성이 높아졌다는 언론보도도 뒤따랐다. 이처럼 공익데이터로 사회문제 해결에 활용하는 활동을 이른바 ‘데이터 포 굿’(Data for good)으로 분류한다.
데이터 포 굿이 활성화되려면 시민이 데이터를 읽고, 데이터에 기반해 사고하며, 더 나아가 데이터에 기반해 행정과 정치에 참여하는 기제가 완성돼야 한다. 이를 위해 기초가 되는 것이 바로 데이터 문해력, 즉 데이터 리터러시다. 필자는 시민의 데이터 리터러시를 높이기 위해 투명사회를 위한 정보공개센터를 중심으로 오픈 데이터랩 프로젝트를 통한 시민교육을 시도하고 있다.
(교육 관련 내용은 dataforgood.kr 에서 살펴보실 수 있습니다. )
내가 생각하는 가장 높은 수준의 시민 데이터 리터러시는 단순한 의견수렴이 아닌 데이터 기반 의사결정에 참여하는 시민참여의 혁신을 가능하게 하는 것이다. 예컨대 서울시에서 심야버스인 올빼미버스 노선 결정을 위한 빅데이터 분석 과정에 시민이 주체로 참여하고 데이터 분석 결과를 논평할 수 있는 수준이 될 것이다. 프랑스의 경제분석위원회에서 디지털공화국법의 성과로 공공의 결정에 사용되는 “알고리즘의 투명성”을 제일 먼저 언급한 것이 이를 방증한다.
앞에서 소개한 옐프 사례에선 드리븐데이터(drivendata.org)라는 데이터 중간지원조직이 큰 역할을 했다. 드리븐데이터는 알고리즘 경진대회를 주관하고, 옐프사의 데이터와 보건당국 그리고 데이터과학자를 연결하는 일을 했다. 오픈 데이터랩 프로젝트도 이처럼 여러 이해당사자 간 가교 구실을 하는 데이터 중간지원조직을 지향한다.
최근 서울디지털재단과 함께 데이터 리터러시 교육 협업을 하면서 민간과 공공을 아우르는 데이터 중간지원조직으로서 재단의 가능성을 목격했다. 시민사회에 기반을 두고 있는 오픈 데이터랩과 같은 당사자들과 재단이 가진 전문가 네트워크, 지방자치단체와의 연결지점이 시너지 효과를 낼 수 있을 것으로 보인다. 올해 재단과 진행한 데이터 액티비즘 스쿨에서는 시민단체 활동가와 공무원이 함께 교육을 받으며 데이터를 기반으로 한 민관교류의 장이 열리기도 했다. 재단은 공익데이터를 폭넓게 확보하고 해당 주제로 활동하는 네트워크를 구축해 시민이 원하는 데이터 관련 프로젝트를 제공함으로써 시민의 데이터 리터러시를 완성하는 역할을 맡게 될 것으로 보인다. 재단이 시민과 데이터 전문가 그리고 지방자치정부를 이어주는 마중물 구실을 넘어 데이터 기반 행정혁신과 시민참여를 뒷받침하는 명실상부한 데이터 중간지원조직으로 거듭나길 기대해본다.
박지환 변호사
* 이 글은 한겨레신문에도 실렸습니다.