2021. 3. 30. 14:31ㆍ카테고리 없음
이번 3월 26일까지 코엑스에서 진행한 인공지능대전 박람회를 참가하고,
이 중에서도 눈길을 끌었던 솔루션을 찝어보고, 더 나아가 조금 심층있는 조사를 해보도록 하겠습니다.
일단 가장 인상 깊었던, 디지털 익명화 기술을 가진 Deeping Source (디핑 소스)
인공지능 산업이 커질 수록 간과하고 있다는 것이 개인정보가 포함된 데이터를 활용할 때,
법적 규제와 이를 지키려는 막대한 비용이 든다는 어려움을 직면하게 됨!
하지만 데이터 확보와 개인정보 보호를 동시에 성취할 수 있도록 하는 것이 바로 디핑소스!
인공지능 산업이 커질 수록 간과하고 있다는 것이 개인정보가 포함된 데이터를 활용할 때,
법적 규제와 이를 지키려는 막대한 비용이 든다는 어려움을 직면하게 됨!
하지만 데이터 확보와 개인정보 보호를 동시에 성취할 수 있도록 하는 것이 바로 디핑소스!
일단은 크게 2가지로 솔루션을 볼 수 있음.
1) 데이터 익명화 - Anonymizer
2) 데이터 소유권
1) 데이터 익명화 Anonymizer
기존의 데이터 보호법으로는, 기존의 데이터를 훼손/ 삭제 해나가는 방법 이었음.
하지만, 정말 필요한 것만 얻고 나머지는 익명화 하는 기술
-
데이터 활용도와 프라이버시 보호
-
머신러닝 모델을 학습 시키면서 동시에 개인정보 보호법 준수
피드백: 이 솔루션이 나의 이목을 가장 끌었던건 GDPR 기준 준수를 한다는 것인데,
이 부분에 대한 Appeal이 홍보물에는 표현이 많이 되지 않아있어서, 많이 아쉬웠었음.
1) 원본 데이터를 익명화
2) 익명화 된 데이터로 머신러닝 모델 구축
3) 실제 환경에서 익명화 된 데이터로 만들어진 모델로 predcition 진행!
추가적으로 데이터 익명화에 Obfuscator이라는 기밀 데이터 공유 방법이 있음.
제 3자에게 기밀이 포함된 데이터를 공유해야하는 경우, 읽지 못하는 상태로 전달해서,
아예 유출 가능성을 배제 해 버리는 것임.
예를 들어, 폐 진단 AI 기술이 있다고 하고, 이에 대한 reasons & proofs가 확인이 되어야 할 경우,
기술 전체를 보여줄 필요 없이, 필요한 부분만 뽑아내서 보여줄 수 있다는 것.
제 3자가 이 데이터를 원상 복구 시킬 수도 없게 만듬.
-> 인공지능 산업이 뜨다보면, 윤리적인 문제가 생기거나 하였을 경우, 법원에서 기술적인 부분을 증빙해나가며
보여줘야하는 경우가 생길 텐데, 기술을 보존 해 나가면서 증빙을 가능하게 해 줌으로써 기술 유출을 줄일 수 있음.
2) 데이터 소유권
일단, 서비스 별로 Jammer 와 Watermaker로 이름을 정하였는데,
Jammer는 데이터에 읽을 수 없도록하는 신호를 넣어서 데이터를 교란시킴.
그러하여 불법적으로 복제 되었을 때, 인공지능 학습에 사용할 수 없도록 하게 됨.
(중요) 최근 일론머스크가 데이터/ 이미지에도 지적 재산권을 넣는 기술에 투자한 소식을 들은 적이 있는데,
그런 것만 보아도 데이터 내에서의 ecology를 만들어나가는데에 많은 투자가 생길 것으로 파악됨 .
Watermaker 같은 경우는, 데이터에 water mark를 함으로써
불법 복제 되어도 확인 할 수 있고, 재판매가 힘들게 함.
데이터의 Masking 처리화라고 보면 될듯!
일단 너무 흥미롭고, 이후에도 가능성이 많은 디핑 소스!
디핑 소스 찾다가, 지능정보산업협회에서 선정한 Emerging AI + X Top 100업체를 찾았는데,
여기 회사들도 아주 유심하게 볼만 할 것으로 보인다!!