FIMO

반응형

SF영화에서만 보면 AI가 상용화 될 것이라고 누가 예상했을까? 물론 연구가 시작된지는 꽤 오랜시간이 흘렀고 다양한 방법론의 변화도 있었다. 그때문에 AI를 연구하던 사람들은 신기하지 않을 수 있지만 일반인들은 ChatGPT로 인해서 AI를 처음접해보고 관심이 생겼을 것이라고 생각한다.

 

 

대다수의 사람들이 AI를 위해서는 모델이 중요하고 생각한다. 하지만 그것은 오산이다. 중요한 것은 데이터이다. 어떤 데이터를 가지고 학습시켜야 하는지가 어떤 모델을 선택해야 하는지 보다 중요하다는 것이다. 이러한 AI가 작동하기 위해서는 수많은 데이터가 필요하다. AI모델은 많은 사람들에게 무료로 공개되는 반면 데이터는 비공개 되어있는 경우가 많다. 특히 금융데이터들은 더욱 비공개 되어있다.

 

 

그래서 정부는 지난 3월 7일 금융데이터를 공유, 개방, 규제에 대한 논의를 위해서 금융데이터 정책 간담회를 진행했다.

 

 

정부는 개인정보호보법을 개정해 금융, 공공기관에서만 마이데이터를 사용하는것이 아니라 다른 기관에서 또는 기업에서 마이데이터를 사용하는 것을 가능하게 만들었다. 예를들어 지금의 대출비교 서비스는 혁신금융서비스를 제공하는 기업 예를들어 토스같은 기업에서만 가능했으나 이제 은행에서도 가능하게 만들겠다는 것이다.

 

이전에도 언급했던 대환대출 플랫폼을 효과적으로 운영하기 위해서 주택담보대출의 판매가 필수적이라고 언급했었는데 데이터가 공유 된다면 (예를들어 기존 대출 현황 등, 내 개인적인 사견이지만 주택담보대출의 과정이 너무 복잡하고 실물서류가 필요한 경우가 대부분이라 어려울 것이라고 생각한다. 어쨋든) 플랫폼의 사용자도 늘어나고 대출뿐만 아니라 금융상품 또는 보험까지 커버하게 된다면 소비자의 자산 형성에 도움를 줄 수 있다.

 

 

결국 이러한 마이데이터, 데이터 공유, 개방이 민간사업자에게까지 이루어져야 데이터를 활용한 사업이 더욱 활성화 될 것이다. 하지만 이에 대한 장벽도 존재한다.

 

 

가장 큰 문제점은 데이터를 어떻게 공유 공개할 것인가이다. 가장 쉬운 예로 삼선전자의 이재용 회장을 예시로 들 수 있다. 이재용 회장의 삼성전자 지분은 공시되어 있다. 만약 금융 데이터가 공개되었을 때 주식보유액을 통해서 이재용 회장의 금융 데이터가 유추가능하다.

 

 

이재용 회장의 데이터를 가장 쉬운 예시로 들었지만 사실 자신 주변의 사람을 특정하는것도 매우 쉬울 것이다. 당신은 자신의 자산이 모두에게 공개된다는 그에 대해서 동의할 것인가? 그래서 민간에게 금융데이터를 공개하는 것은 어렵다.

 

 

그래서 데이터에 대한 변조나 기존의 데이터와 동일한 성질을 가지고 있는 새로운 데이터를 생성해야만 한다. 하지만 이에 대해서는 아직 명확한 해결법이 없다. 그리고 결코 쉬운일도 아니다.

 

 

우리나라가 2017년 데이터 공개 부문에서 1위를 기록할 정도로 데이터 공개에 힘쓰고 있다. 좋게 말하면 데이터가 국가차원에서 잘 관리되고 있다는 것이지만 반면 정보유출우려도 크다는 것을 의미한다. 우리나라의 데이터 공개 수준은 높다. 하지만 그 데이터들이 활용하지 못할정도거나 지역적인 데이터들이 많다. 나는 정부가 이에 대해서 지역적으로 공개된 데이터를 전국적으로 확대시킬 필요성이 있다고 생각한다.

 

 

금융 데이터, 건강 데이터를 공개하는 것도 좋지만 그 전에 지역적인 데이터를 전국적 데이터로 먼저 확장하는 과정을 거쳐야지 데이터 활용에 대한 수요가 늘어나고 나중에 더욱 고차원의 데이터가 공개되었을 때 활용도도 극대화 될 것으로 생각한다.

 

 

그래도 이러한 데이터 공유 공개를 위한 간담회를 진행한다는 것을 통해 앞으로 우리나라에서 데이터를 활용한 산업을 하기에 적합하다는 것을 의미한다. 다른 나라에서는 공개되지 않는 데이터를 공개해서 부가적인 수익을 창출하게 만든다니 아직 아무도 가지 않은 길을 걸을 수 있다는 것은 얼마나 설레는 일일까?

반응형

공유하기

facebook twitter kakaoTalk kakaostory naver band