최근 정부는 포스트 코로나 산업대책의 일환으로 디지털뉴딜정책 추진, 국민생활과 밀접한 데이터를 개방하고, 개방 데이터 양을 확장하겠다고 발표했습니다.

그러나 2019년 현재 40% 이상의 기관들이 공공데이터 운영에서 ’미흡’하다는 평가를 받고 있고, 시민들 역시 '필요한 데이터 없음', '확보방법 모름', '인프라 부족' 등의 이유로 공공데이터 개방에 대한 효능감을 크게 느끼지 못하고 있는 것이 현실입니다. 때문에 근본적인 변화 없이 데이터 수량만 늘린다면 현재 데이터개방의 문제들이 더 심화될 것이라는 우려가 제기되고 있습니다.

이에 정보공개센터에서는 지난 8월 12일 을 열어 "시민들에게 어떤 데이터가 필요한지", "쓸만한 데이터란 무엇인지"에 대해 회원들이 함께 편하게 이야기하고 고민해보는 자리를 마련했습니다.

이번 오픈테이블은 1차 온라인 모임과 2차 소규모 오프라인 모임으로 나눠 진행되었는데요, 각 모임에서 쏟아진 정공센 회원들의 '오픈 데이터' 이야기를 공유합니다!
먼저, 1차 온라인 모임에서는 각자 관심있는 공공데이터와 데이터 수집 경험에 대한 이야기를 나눴습니다. 

1. 우리가 궁금한 데이터는

[도시개발 및 부동산 관련 데이터] 
  • 이웃 지역주민과 공공에 엄청난 영향을 미치는 데도 불구하고 재개발 도시개발 과정에 대한 내용에 접근하기가 너무 험난하다. 회의록이나 계획 같은 것들도 당사자가 아니라면 볼 수 없는 구조. 당사자들도 아주 소수들에게만 공개해 개발과정의 갈등이나 정보불평등 문제가 불거진다.  조합원이 클린업시스템에서 정보를 확인할 수 있지만, 조합원으로 한정. 심지어 공공이 시행할 때는 클린업 시스템에 올리지 않아도 되는 문제가 있다.
  • 도시개발과정에서 도시개획심의위원의 인허가 결정이 있어야 하는데 그 내용들은 대부분 비공개 된다. 이 자체가 매우 폐쇄적인 구조. 이를 위해 단순 정보공개만이 아니라 결정플랫폼의 재설계가 필요하다.
  • 도시를 만드는 과정의 기록은 있긴 하지만, 그것이 데이터화되어있지는 않음. 문제는 그런것들이 뒤늦게 기록화 되는 문제 있음. 경실련 등에서 분양원가공개소송에서 승소하기도 했는데, 이런 사례를 봤을때, 지금껏 공개되지 않던 것들을 공개의 영역으로 전환해서 시민들과 정부가 함께 환기하는 것 필요한것 같다. 클린업사이트 같은 경우도 일정 부분은 시민들에게 열어두는 것 필요.
  • 클린업 같은 재개발 정보들을 비조합원들도 볼 수 있게 하는 것은 중요하고, 맞다고 본다. 부동산 정보 같은 경우도 더 많은 정보의 공개가 필요한데, 그것이 뭐가 있을지 얘기해보면 좋겠다. 실거래가액,  필지별 소유권의 변화, 전월세가격 변화 등의 데이터 공개 방식이 바뀌어야 한다. 
  • 부동산3법 개정되면서 전월세 가 공개는 되는 것으로 갈텐데, 재산권이나 개인정보 등과 공익성에 대한 논쟁이 많을 것 같다. 
  • 세입자에게 건물주의 국세체납이나 임금체불 여부 확인할 수 있도록 공개하는 것도 필요하다. 이 문제 역시 개인정보이슈로 논쟁 사항일 것 같다. 
  • 도시데이터를 이야기 할 때 기록의 방식과 접근의 방식이 있을것.  기록의 경우 서울기록원 등 전문기관이 전담하고 사업을 추진하는 것도 필요. 역할분담 필요. 접근은 연령/도구 등의 문턱을 낮추는 플랫폼이 필요. 그래야만 정보의 유통체계도 달라질 수 있음. 

[경제 데이터]
  • 경제데이터에 관심이 많은데, 경제지표 데이터는 한국은행에 올라가는 게 있고, 나라정보에 올라가는 데이터가 있고, 통계청에 올라가는 게 있다. 그런데 그게 조금씩 수치와 기준이 달라서 어디에 들어가야 할지가 애매하고, 공개하는 형식도 조금씩 다르다. 통계에 대한 해설 기준도 다른데, 예를 들면 한국은행은 해설을 꼼꼼하게 하는데 해설이 부족하거나 없는 경우도 많다. 공개하는 형태도 서비스가 불안정한 플래시 파일로 되어있거나, 2000년대 이전 자료들은 이미지 형태의 PDF 책자로만 공개되어 활용이 어려운 측면이 있음


2. 험난한 데이터 활용의 길 

  •  2018년부터 공공데이터에 관심을 갖고 조사를 했음. 정보에 접근하려 할때 제한되는 게 너무 많음. 비공개되는 것도 많고, 공개되더라도 활용하기 힘든 형태 (한글파일 혹은 이미지 스캔파일 등)라 정제할 엄두가 나지 않는 경우가 많았다. 또 접근하기 쉬운 플랫폼 ux도 필요한 것 같다. 
  •  공개를 하는데, 이게 뭐는 정보공개법이고 뭐는 통계법이고 뭐는 데이터법이다. 이걸 시민들이 다 알고 있어야 한다. 정부 창구의 일원화가 필요하다. 문서를 전자화 하는 것은 정부에서 쉽지 않을것이다. 그렇기 때문에라도 이것은 별도 사업으로 다뤄져야 한다. 그리고 (처음부터 데이터화된 정보를 생산하는 체계가 없다는 점에서) 공무원들의 일하는 방식이 제일 큰 문제. 공개비공개도 이슈인데, 데이터법 상에서는  공개의 포맷이 정해져 있는데 많은 정부 생산 문서들이 거기에 적용 되지 않는 문제가 크다.
  • 디지털뉴딜을 볼 수 있는 사이트가 있는데, 거기에 디지털 뉴딜을 설명하는 것이 모두 기계가독 불가능한 이미지 형태다. 이것이 단적인 예가 될 것. 문서생산 과정부터 문제다
  • 저작권과의 문제도 어떻게 해야 할지 어려움. 정부에서도 정리 자체가 되지 않는 것 같다.
  • 정부의 저작물은 공공누리 표시가 기본. 데이터도 특정라이센스 지정되어 공개되는 것이 있기도 함. 문제는 별로 고민 없이 라이센스를 지정하는 것 같아 보임. 상업이용제한하는 라이센스가 달려있어서 사용에 제한이 매우 많은데 정작 라이센스 부여한 담당자는 그걸 모르는 경우도 있음. 데이터 라이센스를 자문해주는 별도의 단체들이 필요해보인다. 
  • 정보를 생산한 사람이 공무원이고 그 사람이 데이터를 개방하기도 한다. 분명 어려움이 있을 것. 이 업무를 분리해서 데이터화와 관련해 업무를 통제하고 관리하는 시스템을 만드는 것 필요. 
  • 그래서 데이터청 논의가 나오는 것 같다. 현행의 행안부 데이터담당관실로는 컨트롤이 안되니, 그것을 컨트롤하기 위해 데이터청 얘기가 나오는데, 아직 구체적으로 뭘 하겠다는 건지는 불확실하다.
  • 데이터청이 잘 하면 좋긴 한데, 또 하나의 분산이 생길 수 있어서 걱정이 되긴 함. 하지만 큰 방향에서는 맞는 것 같음. 여러 부처에 흩어져있는 역할들을 통합할 필요 있음. 
  • 사실 기존 통계청에서 수집하는 정보들이 상당히 많고, 공개도 더 확대되고 있는 추세지만 활용이 어려운 부분도 있다. 마이크로데이터는 통계 모르면 너무 쓰기 어렵겠더라. 
  • 통계청 사이트 들이 조사한 모든 데이터가 공개되는 것이 아니다. 공개를 안하는 이유는 여러가지가 있겠지만, 시민들이 통계를 어려워하고 잘 모르기 때문이라는 인식도 있는 것 같음. 전반적으로는 통계교육이 강화되어야 한다라고 생각. 시민들이 통계에 대해 많이 알게 되었을때, 통계청도 높은 수준의 통계정보들을 공개하게 될 것이라 생각한다. 
  • 통계청 마이크로데이터서비스를 시민단체가 많이 쓰면 좋겠다. 나는 사망원인 통계 볼 때 아주 유용하게 썼다. 마이크로데이터시스템에 들어가면 승인 절차가 있는데, 과연 그런 절차가 필요한지는 의문이다. 어차피 시민들에게 공개한다는 대원칙이 있는 것인데, 마이크로데이터 역시 추출이나 승인과 같은 절차 없이 시민 관점에서 전향적인 논의가 필요하다. 


저녁에 이어진 2차 소규모 오프라인 모임에서는 1) 어떤 데이터가 어떻게 공개되어야 할까? 2) 데이터 뉴딜을 하면 인력과 자원이 투입이 될 텐데 공공데이터의 어떤 부분에 돈과 사람을 투입해야 할까? 에 대한 질문을 두고 의견을 나눴습니다.


1. 어떤 데이터, 어떻게 공개해야 하나?
    
  • 공직감시와 관련된 데이터때문에 담당직원과 통화하다보면, 공직감시 관련 정보를 ‘공공데이터’라고 생각하지 않는것같다. 공직감시에 대한 공공데이터 카테고리가 있어야 한다고 생각한다. 지방의회의 경우 동일한 포멧으로 공개되고 있지 않다. 각지자체 마다 공개하는 양식이 다르기때문에 데이터를 취합하기 매우 어려움. 행안부의 경우 지자체를 컨트롤 하고 싶어하지 않고, 지자체도 기관 마음대로 공개해버린다. 공공데이터 개방에 있어 지자체 정보를 일정한 양식으로 공개할 수 있도록 데이터셋을 만들면 좋겠다. 
  • 비슷한 사례로 각 지자체에서 공개하는 인구데이터가 다르다. (통계청통계, 지자체별 통계 다 다름) 데이터 공개양식이 다르다보니 데이터를 습득하는 시민마다 습득할 수 있는 데이터의 질이 다르게 됨. 각 지자체마다 동일한 업무관리시스템을 사용할텐데, 공개 양식이나 데이터셋이 다르다. 
  • 각 기관별 수집을 어디서 하는지, 언제 어떻게 하는지 교통정리가 필요. 각 기관, 지자체, 통계청 등이 같은 내용의 데이터를 모으는데도 합쳐진 데이터 자체를 찾기가 힘듦. 공공데이터포털의 경우에도 기관별로 파일을 다 올리기  때문에 동일한 양식의 데이터를 한번에 확인하기 어렵다. 
  • 시민의 입장에서 나의 데이터를 어떻게 활용하는지 알지 못하는부분, 이러한 정책이 시행 왜 시행되었는지 전혀 알 수 없어 답답하다. 심지어 데이터 3법을 통과시킨 위원회 회의록조차 비공개이다. 
  • 동네에서 조금이라도 변화시킬 수 있는 무기를 장착하려면 어떤 게 있을지 항상 고민이다. 지역에서 활동하다 보면 필요한 부분을 너무 터무니 없이 감추고 비공개하려고 하는데, 자기네들끼리 뭉쳐있다는 느낌을 받는다. 합리적으로 빠져나갈 수 있는 방법을 어떻게든 만들어놓고 그 방식대로 하고. 2016년 자료를 공개하면 부동산 가격에 영향이 있다며 비공개하기도 하고, 심지어 홈페이지 공개 되는 정보임에도 그렇게 할 때가 있다. -> "PDF나 한글파일 말고 엑셀 그대로 올려라"운동, 심의회에 청구인 의견 개진 통로 만들기 등, 신문에 기고 이런 활동들이 전방위적으로 필요한 것 같다ㅠㅠ  


2. 데이터 뉴딜, 시민이 원하는 공공데이터 개방을 하려면?

[정보 생산 단계에서의 데이터]  
  • 14만건 공개가 아닌 고도화가 필요한 것 같다 이미 있는 정보들도 구조화가 안되서 못쓰는 게 많다. 
  • 업무 자체를 디지털화 하는 것이 필요함 파일이라는 개념을 없애야 함. 데이터베이스로 입력하는 방식으로 업무를 진행해야 한다. 공공데이터개방에 있어 데이터 개방건수로 지표화 하는 것들로 평가해서는 안된다. 
  • 공감한다. 노션(Notion)프로그램으로 업무를 하고 있는데 모든 일들이 데이터베이스화가 됨. 한글파일 보고용 쇼잉의 방식으로 하다보면 데이터화에 문제들이 생기는 것 같다. 공무원들이 내가 하는 일이 백일하에 드러내는게 당연하다는 의식을 공유해야 할것 같다. 공공이 일하는 방식이 너무나 폐쇄적이라는 인식이 중요한 것 같다. 
  • 서식에 대한 통일은 엄격하면서 데이터 양식에 대한 통일이 안된다. 디지털뉴딜의 시작은 사무관리규정의 디지털화가 아닐까.
  • 업무 단계에서 데이터 양식을 적용하는 것은 매우 중요하지만, 빠르게 시행될 수 없다. 가능한 시도로는 사전정보공표정보 생산부터 데이터화가 가능할 수 있지 않을까? 담당공무원이 업무자동화를 통해 업무량을 줄일 수 있고 사전공표 정보 데이터 축적도 할 수 있음

[공공데이터 개방의 원칙]
  • 영국이나 미국의 경우 전자정부를 만들때 업무관리시스템 만들기 전에 대원칙을 정하고 시스템을 개발한다. 거기서 가장 중요한 원칙중 하나는 "시민이 확인할 수 있는 정보의 창구는 하나여야 한다." 이다. 기본적으로 공공데이터에 대한 철학이 부재한 상태이다.  
  • 행안부에서 발행한 웹사이트 표준에 대한 가이드라인이 있는데 안지킨다. 있는데 안지키는건지 교육을 안해서 모르는건지 도통 모르겠다. 어떤 기관이라도 정보공개의 표준적인 서비스를 받아야 한다. 
  • 가이드라인 있지만 그 가이드라인 자체도 문제이다.  또한 공공데이터를 개방하는 사이트가 몇개인지 조차 정부는 파악하지 못한다. 
  • 정부에서 운영하는 사이트 몇개인지, 자기네 도메인 달고 있는 사이트가 뭐가 있는지 총괄하는 부서도 없고 아무도 모름. 사전정보공표 링크 눌러보면 NOT FOUND, 도메인 광고 뜨는 것도 많다. 행안부에 도메인 등록하는 시스템이 있는데 여기로 한 것은 5000개 정도 된다고 한다. 데이터 환경에 대한 이해 자체가 부재한 것이 문제인 것 같다. 국립국어원이 예시인데 사이트 개편하면서 예전에 뿌려진 링크가 다 오류나는 경우가 있었다.
  • 영국, 대만 사례의 경우 데이터에 대해 총괄하는 사람이 전문가로 구성되어 있다. 한국의 가장 큰 문제는 해당 정책을 끌고 가는 사람이 전문가가 아니고, 더 큰 문제는 전문가의 이야기를 들으려고 하지 않는다. 
  • 미국의 경우 오바마 정부 시절 18F 사례(백악관) 스타트업에서 일하던 개발자와 행동과학자와 함께 미국정부 디자인 시스템, 전자정보를 이용하는 가이드 등 전자정부에 대한 전체적인 가이드라인을 개발한 사례가 있다. ​ ( http://www.bloter.net/archives/239720 참고)
  • 공공데이터를 총괄 관리하는 것이 필요하긴 한데, 데이터청이 되면 안될 것 같다. 부처 칸막이가 안그래도 심한데 기관이 말을 듣게 하려면 대통령 직속이나 부? 정도는 되어야 하지 않을까? 
  • 청 단위 보다는 대통령 직속 기구나, 개인정보 보호와 연동하여 독립기관이 필요할 것 같다. 
  • 개인정보보호, 데이터개방에 대한 정책, 공공기관 업무방식 세가지를 총괄할 수 있으면 좋겠다. 그 중에도 업무방식을 어떻게 디지털화 할것인가, 그다음 개인정보보호에 대한 정책을 어떻게 시행할것인가를 집중해서 진행한다면 데이터개방은 자연스럽게 확인할 수 있다. 
  • 정보공개와 데이터개방의 차이들을 담당자들이 인지하지 못한다. 때문에 현행에서는 구분하여 정의와 기준이 있는 가이드를 마련해야 한다. 예> 보고하거나 발표하기 우해 만들어진 정보는 정보공개청구 / 업무를위해 시스템에 입력된 것을 추출해도 되는 것을 데이터 제공 신청해라
  • 이런 의견이 전부터 있어 왔는데 사실 관계 부처에서 알고 있는 경우도 있음. 적용될 수 있도록 어떤 것은 어떤 형태로 공개해야 한다 이런 것들을 통합되기 전에 다시 주장 해야 할듯 함. 
[공공데이터의 가치]
  • 정보접근권이 달라서 데이터 이용할 수 있는 사람은 이걸로 돈을 벌고 못하는 사람은 소외되는 현상도 유의해야 할것   
  • 데이터를 활발하게 활용하는것은 매우 중요한것이다. 실제로 기상청 데이터를 통해 수확물, 수확량등을 예측하여 관련 종사자들이 활용하게끔 하는 부분들 중요함.
  • 정보공개법의 비공개 조항도 더 구체화 필요. 처벌조항도 너무 필요하다. (사실 처벌 조항을 피하는 여러가지 술수들이 난무하고 있어 문제임. 부존재 남발, 실제 내용은 빠진 공개통지 등)
  • 정보공개, 오픈데이터 관련한 의견을 시민사회 차원에서  정리해서 이번 기회에 요구하면 좋겠음
  • 데이터 청원 포털을 만들어서 청원을 하면 담당자가 나와서 왜 비공개인지 설명하는 것도 좋을 것 같다. -> 놀랍게도 '데이터 1번가'라는 청원사이트가 이미 있지만 내실있게 운영하지 않아 무용한 수준이다.
  • 공공데이터 개방을 했을 때 문제가 생기는 것도 중요할 것 같다. 이게 데이터화 되었을 때 어떨까에 대한 비전을 가질 수 있었으면 좋겠다. 그게 안되면 우리가 포기하는게 무엇이고 이런걸 알고 싶다. 
  • 데이터 개방이 잘될경우 세상은 크게 변하지 않지만, 데이터가 공개되지 않았을때 일어나는 문제들/ 잘못 개방 되었을 때의 문제에 대해서 고민 하는 것이 중요할 것 같다.
위와 같이 두차례의 오픈테이블에서 공공데이터와 관련한 현재의 문제점들과 우리의 요구를 짚어볼 수 있었는데요, 자리를 마치며 앞으로 또 이런 자리가 있었으면 좋겠다는 의견, '마이크로데이터 데이' 등 데이터 활용 프로젝트를 진행하자는 아이디어, 관심분야를 주제로 한 정보공개 실패 공유모임을 하자는 의견이 나오기도 했습니다.

정보공개센터는 오픈테이블의 논의를 바탕으로 데이터뉴딜에 대한 진행과정을 지속적으로 모니터링하고 의견을 개진할 예정입니다. 또 공공데이터를 기반으로 회원들과 구체적인 활동을 함께 할 수 있도록 기획할 예정입니다. 그럼 다음 오픈테이블에는 어떤 흥미로운 이야기와 활동들이 펼쳐질지 기대해주세요!