전북대 조재혁 교수팀, 소셜 미디어 루머 탐지 AI 알고리즘 개발98% 이상 정확도 달성, 가짜뉴스 확산 방지 기대
이번 연구에서 제안된 하이브리드 모델은 BERT-OPCNN과 FIAC 임베딩을 결합하여 잘못된 정보와 루머를 탐지하고 분류하는 데 탁월한 성능을 보였다.
BERT는 문맥 정보를 양방향으로 처리하여 텍스트의 의미를 정확히 파악하고, CNN은 이미지 처리에 최적화된 딥러닝 모델로 텍스트의 지역적, 전역적 특징을 효과적으로 추출하는 데 기여했다. 이 두 가지 모델을 결합한 BERT-OPCNN이 첫 번째 단계에서 핵심적인 특징들을 추출했다.
두 번째 단계에서는 FastText 임베딩과 정보이득 기반의 개미군집 최적화(FIAC)를 사용해 정교한 특징 벡터를 생성했다. FastText는 단어를 n-gram 방식으로 분해해 드문 단어에도 임베딩을 생성하는 데 강점을 보였고, 정보이득 기법을 통해 중요한 특징을 선택한 뒤 개미군집 알고리즘을 적용하여 최적화된 벡터를 만들었다. 이렇게 생성된 벡터는 루머 탐지를 위한 최종 학습에 사용됐다.
결과적으로, 연구팀의 모델은 LIAR와 Fake & Real News(ISOT) 데이터셋에서 98.24%의 높은 정확도를 달성했다. 이 성과는 정보 증강 기법을 통해 데이터의 다양성을 확보하고, 실시간 루머 탐지 시스템의 성능을 크게 향상시키는 데 기여했다. 특히, 클래스 불균형 문제를 해결하기 위해 비용 민감 학습(CSL) 기법을 적용하여, 데이터 편중에 따른 오류를 최소화했다.
조재혁 교수는 이번 연구에 대해, "소셜 미디어에서 잘못된 정보의 확산을 방지하고 신뢰할 수 있는 정보 환경을 조성하는 데 중요한 기여를 할 것"이라며, "향후 다양한 언어와 플랫폼에 적용할 수 있는 기술 확장 연구를 통해 상용화를 목표로 할 것"이라고 밝혔다.
연구팀은 이 기술의 상용화를 위해 2024년 7월에 특허 출원을 완료하고, 등록 절차를 진행 중이다.
이 기사 좋아요 1
<저작권자 ⓒ 특허뉴스 무단전재 및 재배포 금지>
댓글
전북대,가짜뉴스탐지,루머,인공지능알고리즘 관련기사목록
|
많이 본 기사
|