세계가 놀란 ‘AI소라’, 텍스트만으로 완성도 높은 동영상 ‘뚝딱’... 딥페이크 대책은?

AI소라에 적용된 특허기술 그리고 딥페이크에 대응하는 특허기술은

특허뉴스 이성용 기자 | 기사입력 2024/03/24 [18:28]

세계가 놀란 ‘AI소라’, 텍스트만으로 완성도 높은 동영상 ‘뚝딱’... 딥페이크 대책은?

AI소라에 적용된 특허기술 그리고 딥페이크에 대응하는 특허기술은

특허뉴스 이성용 기자 | 입력 : 2024/03/24 [18:28]

▲ 출처=https://openai.com/sora 동영상 캡쳐  © 특허뉴스

 

 

최근 매스컴에서 연일 화제가 된 영상이 있다. 텍스트 입력만으로 AI가 영상을 만들었는데, 정교함과 완성도 높은 영상이었다.

 

“A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.”

 

이 문장을 입력해 영상을 만들어 냈다.

GPT 개발사 오픈AIAI산업의 새로운 패러다임을 제시한 영상 생성 'AI소라(SORA)'로 만들어 낸 영상이다.

AI소라가 만들어내는 영상의 완성도가 매우 정교해 공개만으로도 충격적인 반응이 나오고 있다.

 

오픈AI가 공개한 AI소라는 텍스트를 입력하면 이를 바탕으로 1분 이내의 동영상으로 만들어주는 '텍스트 투 비디오(Text to video)'모델이다.

 

▲ 출처=https://openai.com/  © 특허뉴스

 

GPT와 같이 기존 텍스트 중심의 AI에서 이제는 이미지와 소리, 영상 등 다양한 형태의 데이터를 동시에 이해하고 처리하는 AI로 발전되는 것이다. 오픈AIAI소라로 만든 48개의 샘플 동영상을 공개했는데, 이것이 현실인지 가상인지 분간이 어려울 정도로 상당히 정교하고 높은 퀄리티를 보여줬다.

 

영상에서 볼 수 있듯 AI소라는 강아지부터 사람들로 붐비는 아프리카의 어느 시장까지 다양하게 표현해 냈다. 텍스트를 입력한 사람이 원하는 모습을 영상으로 정교하게 표현해 냈다.

 

그렇다면 오픈AI는 어떤 특허를 기반으로 AI소라를 세상에 내놓았을까?

오픈AI가 머신러닝 학습에 기반해 비디오 영상을 제작하는 특허가 눈에 뛴다. 최근 공개한 소라 역시 이 특허 기술이 일부 적용된 것으로 보인다.

 

▲ 머신러닝을 사용하여 비디오 및 입력 데이터 세트를 기반으로 자동 인터페이스 동작을 수행하도록 모델을 트레이닝하고 사용하는 것(출처=윈텔립스, US 11887367 B1)  © 특허뉴스

 

 

이 특허는 온라인 데이터를 라벨링하고 클릭이나 키 누름, 터치 등 인간의 물리적인 행동 없이도 자동화된 동작을 실시하도록 기계 학급 모델을 훈련시키는 시스템이다.

 

오픈AI의 다른 특허를 보면, 작년에 출원된 특허는 언어 모델 기반 텍스트 삽입을 위한 시스템과 방법이라는 특허로 언어를 사용하여 텍스트를 자동으로 생성하고 편집하기 위한 시스템 기술이다.

 

▲ 언어 모델 기반 텍스트 삽입을 위한 시스템과 방법(출처=윈텔립스, US 11886826 B1)  © 특허뉴스

 

 

이 기술에는 데이터 입력부터 언어 엑세스, 문장분석, 텍스트 편집, 문장 최적화를 위한 엔진이 포함되어 책GPT의 정확성을 더욱 높일 수 있다.

 

오픈AI는 누구나 이용할 수 있도록 공개한 챗GPT와 달리 AI소라는 샘플만 공개하고 AI소라를 레드팀, 안정성을 시험하는 오픈AI 내부팀과 소수의 학자들, 외부 전문가 그룹에만 서비스와 기술을 공유하고 있다.

 

경찰에 끌려가는 트럼프영상 등과 같은 딥페이크를 이용한 가짜 영상 때문인 것으로 보이는데, 결국 오픈AIAI소라와 같은 생성형 AI모델들이 딥페이크나 심각한 가짜 정보 생산의 주체가 될 수 있음을 인정한 셈이다. 이미 딥페이크는 전세계적으로 빠르게 번지고 있고, 특히 유력 정치인이나 연예인들을 딥페이크에 이용해 사람들을 호도하고 있다. 도널드 트럼프에서부터 일론 머스크, 교황에 이르기까지 딥페이크에 오용되는 사례들이 적지 않다.

 

▲ 출처=freepik  © 특허뉴스

 

정교해지는 딥페이크만큼 딥페이크에 대응하는 기술들도 발전하고 있다.

AI 플랫폼 전문기업 메타버즈에서 개발한 특허기술인 사용자 딥페이크 영상 분석 및 모니터링 서비스 제공방법은 스트리밍 비디오에서 생성된 가짜 이미지를 분석하고 모니터링하기 위한 기술이다.

 

▲ 사용자 딥페이크 영상 분석 및 모니터링 서비스 제공방법(출처=윈텔립스, KR 10-2580768 B1)  © 특허뉴스

 

 

웹사이트에서 서비스되는 스트리밍 영상 중 딥페이크가 존재하는지를 정밀하게 검증, 모니터링하고 해당 영상의 폐기까지 유도할 수 있는 딥페이크 영상 분석 및 모니터링 서비스이다.

 

딥페이크는 영상뿐 아니라 음성 위변조에도 공공연히 악용된다. 이를 방지하기 위해 구글에서도 위변조 오디오를 검출하기 위한 기술을 개발했다. 구글의 이 기술은 음성에 합성 스피치가 포함되어 있는지 판별하기 위한 오디오 데이터를 분류하는 시스템이다.

 

▲ 페이크 오디오 검출을 위한 자기 지도형 음성표현(출처=윈텔립스, KR 10-2023-0116886 A)  © 특허뉴스

 

 

이 시스템을 이용한다면 위변조된 음성이 유튜브를 비롯한 음성 플랫폼으로서의 송출되는 것을 사전 차단하는데 효과가 있을 것으로 기대된다.

 

최근 오픈AI와 구글, MS 등 생성형 AI모델들을 개발 중인 빅테크들은 독일에서 열린 '뮌헨안보회의(MSC) 2024'에서 'AI생성 딥페이크 대응을 위한 프레인워크 채잭 협정에 서명했다.

 

이 협정에 참여한 각 기업들은 날로 교묘하고 정교해지는 딥페이크 기술이 되레 자신들의 생성AI기술을 앞지르고 있다고 입을 모았다. 이미 발전하고 있는 딥페이크를 방지하기 위해선 대응기술도 중요하지만 무엇보다 딥페이크를 방지할 수 있는 강력한 글로벌 AI규제 법안이 기초가 되어야 할 것이다.  

이 기사 좋아요
  • 도배방지 이미지

광고