데이터댐 그리고 데이터청과 같은 논의가 나오는 시점이기에 ‘데이터 경제’라는 말이 더 실감나는 시기인 것 같다. 개인적으로도 데이터에 대한 관심이 많아, 한국방송통신대학교의 통계학 석사과정에 재학하면서, 통계의 기초부터 머신러닝과 딥러닝에 관련된 공부를 하고 있다. 그런데 통계를 공부한 실무자의 관점에서 생각해보면 변호사로서 생각하는 추상적인 개념으로서의 데이터와 실제 현장에서 사용되는 구체적인 자료로서의 데이터에 대한 인식의 차이가 크다는 걸 느끼게 된다.

흔히 많은 사람들이 ‘데이터는 미래 산업의 원유’라는 말을 한다. 데이터의 중요성을 강조한 은유적인 표현이지만, 한편으로는 데이터가 그 자체만으로 가치를 가지는 것이라고 오해하게 만드는 표현이어서 다소 아쉬움이 생긴다.

최근 데이터의 보고라고 할 수 있는 싸이월드의 폐업신고 소식은 데이터의 가치가 무엇인지에 대해 고민해 볼 수 있는 좋은 사례였다. 데이터가 그 자체로 가치가 있었다면, 싸이월드 데이터를 인수하고자 하는 사업자가 많았을 것이기에 폐업 조치를 한다는 것은 이상하기 때문이다. 결국 이 사례는 데이터가 그 자체로 가치를 가지는 것은 아니라는 점을 보여준다.

데이터의 가치는 데이터 그 자체에 있다기보다는 ①데이터를 통하여 실현하고자 하는 사업이나 프로젝트의 목적과 맥락 ②데이터를 수집한 시점과 활용하는 시점에 관한 시의성 ③데이터를 처리할 수 있는 기술과 능력을 통해 가치가 부여된다. 이러한 맥락에서 통계학에서는 훌륭한 데이터 사이언티스트가 되기 위해서는 도메인 날리지(Domain Knowledge)가 필수적이라는 말을 한다. 해당 산업 분야에서 요구되는 전문지식을 가지고 데이터를 분석해야만 데이터를 통해 가치를 창출할 수 있다.

마지막으로 ‘데이터는 미래 산업의 원유’라는 말에 첨언을 해본다. 땅속에서 추출한 원유는 여러 불순물이 섞여 있는 혼합물이다. 이를 사용하기 위해서는 가열해서 물질을 분리하는 정제작업이 필수적이다. 원유는 불이 붙지 않는다.

 

 

/박우철 변호사

네이버 주식회사

저작권자 © 법조신문 무단전재 및 재배포 금지