대형언어모델로 42% 향상된 추천 기술 연구 개발

염현철 기자 | 기사입력 2024/07/17 [13:29]

대형언어모델로 42% 향상된 추천 기술 연구 개발

염현철 기자

| 입력 : 2024/07/17 [13:29]

▲ 박찬영 교수 연구팀에서 개발한 모델의 개요 / 협업 필터링 모델에서 생성되는 사용자-상품 상호작용 정보와 상품 텍스트 정보를 결합하여 대형언어모델에 주입하는 방식으로 상품 추천을 진행한다. 이를 통해 기존 연구보다 빠른 학습/추론 속도를 달성하였으며, 상품 추천의 정확도를 향상시켰다.(그림 및 설명=KAIST) © 특허뉴스

KAIST-네이버, 대형언어모델 학습 없이 사용자의 상품 소비 이력 및 상품 텍스트 정보를 활용할 수 있는 대형언어모델 기반 추천시스템 연구 개발

8월 데이터마이닝 분야 최고권위 국제학술대회 ‘KDD 2024’에서 발표 예정

대형언어모델 기반 추천 시스템 연구에서 최신 방법 대비 최대 42% 상품 추천 성능 향상, 최대 253% 학습 속도 향상, 최대 171% 추론 속도 향상

대화형 추천 시스템, 개인화 상품 상세 정보 생성 등 다양한 서비스의 등장 기대

최근 소셜 미디어, 전자 상거래 플랫폼 등에서 소비자의 만족도를 높이는 다양한 추천서비스를 제공하고 있다. 그 중에서도 상품의 제목 및 설명과 같은 텍스트를 주입하여 상품 추천을 제공하는 대형언어모델(Large Language Model, LLM) 기반 기술이 각광을 받고 있다. 한국 연구진이 이런 대형언어모델 기반 추천 기술의 기존 한계를 극복하고 빠르고 최상의 추천을 해주는 시스템을 개발하여 화제다.

KAIST는 산업및시스템공학과 박찬영 교수 연구팀이 네이버와 공동연구를 통해 협업 필터링(Collaborative filtering) 기반 추천 모델이 학습한 사용자의 선호에 대한 정보를 추출하고 이를 상품의 텍스트와 함께 대형언어모델에 주입해 상품 추천의 높은 정확도를 달성할 수 있는 새로운 대형언어모델 기반 추천시스템 기술을 개발했다고 17일 밝혔다.

이번 연구는 기존 연구에 비해 학습 속도에서 253% 향상, 추론 속도에서 171% 향상, 상품 추천에서 평균 12%의 성능 향상을 이뤄냈다. 특히, 사용자의 소비 이력이 제한된 퓨샷(Few-shot) 상품(사용자의 소비 이력이 풍부하지 않은 상품) 추천에서 평균 20%의 성능 향상, 다중-도메인(Cross-domain) 상품 추천에서 42%의 성능 향상을 이뤄냈다. 다중-도메인 상품 추천은 타 도메인에서 학습된 모델을 활용하여 추가학습없이 현재 도메인에서 추천을 수행한다. 예를 들어, 의류 도메인에 추천 모델을 학습한 뒤, 도서 도메인에서 추천을 수행하는 상황을 일컫는다.

기존 대형언어모델을 활용한 추천 기술들은 사용자가 소비한 상품 이름들을 단순히 텍스트 형태로 나열해 대형언어모델에 주입하는 방식으로 추천을 진행했다. 예를 들어 ‘사용자가 영화 극한직업, 범죄도시1, 범죄도시2를 보았을 때 다음으로 시청할 영화는 무엇인가?’라고 대형언어모델에 질문하는 방식이었다.

이에 반해, 연구팀이 착안한 점은 상품 제목 및 설명과 같은 텍스트뿐 아니라 협업 필터링 지식, 즉, 사용자와 비슷한 상품을 소비한 다른 사용자들에 대한 정보가 정확한 상품 추천에 중요한 역할을 한다는 점이었다. 하지만, 이러한 정보를 단순히 텍스트화하기에는 한계가 존재한다. 이에 따라, 연구팀은 미리 학습된 협업 필터링 기반 추천 모델로부터 사용자의 선호에 대한 정보를 추출하고 이를 대형언어모델이 이해할 수 있도록 변환하는 경량화된 신경망을 도입했다.

연구팀이 개발한 기술의 특징으로는 대형언어모델의 추가적인 학습이 필요하지 않다는 점이다. 기존 연구들은 상품 추천을 목적으로 학습되지 않은 대형언어모델이 상품 추천이 가능하게 하도록 대형언어모델을 파인튜닝(Fine-tuning/사전 학습된 대규모 언어모델을 특정 작업이나 데이터셋에 맞게 최적화하는 과정)하는 방법을 사용했다. 하지만, 이는 학습과 추론에 드는 시간을 급격히 증가시키므로 실제 서비스에서 대형언어모델을 추천에 활용하는 것에 큰 걸림돌이 된다. 이에 반해, 연구팀은 대형언어모델의 직접적인 학습 대신 경량화된 신경망의 학습을 통해 대형언어모델이 사용자의 선호를 이해할 수 있도록 했고, 이에 따라 기존 연구보다 빠른 학습 및 추론 속도를 달성했다.

연구팀을 지도한 박찬영 교수는 “제안한 기술은 대형언어모델을 추천 문제에 해결하려는 기존 연구들이 간과한 사용자-상품 상호작용 정보를 전통적인 협업 필터링 모델에서 추출해 대형언어모델에 전달하는 새로운 방법으로 이는 대화형 추천 시스템이나 개인화 상품 정보 생성 등 다양한 고도화된 추천 서비스를 등장시킬 수 있을 것이며, 추천 도메인에 국한되지 않고 이미지, 텍스트, 사용자-상품 상호작용 정보를 모두 사용하는 진정한 멀티모달 추천 방법론으로 나아갈 수 있을 것”이라고 말했다.

KAIST 산업및시스템공학과 김세인 박사과정 학생과 KAIST 전산학부 강홍석 학사과정(졸) 학생이 공동 제1 저자, 네이버의 김동현 박사, 양민철 박사가 공동 저자, KAIST 산업및시스템공학과의 박찬영 교수가 교신저자로 참여한 이번 연구는 데이터마이닝 최고권위 국제학술대회인 ‘국제 데이터 마이닝 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2024)’에서 올 8월 발표할 예정이다.

논문명은 Large Language Models meet Collaborative Filtering: An Efficient All-round LLM-based Recommender System 이다.

이 기사 좋아요 1

염현철 기자의 다른기사보기

전체댓글보기

대형언어모델,대화형추천시스템,네이버,KAIST, 관련기사목록

대형언어모델로 42% 향상된 추천 기술 연구 개발

PHOTO

“담보 잡힌 특허도 돈이 될 수 있다!”... 특허청, 담보IP 수익화해 IP담보대출 지원

많이 본 기사

2030년 메타버스 시장 5,078억 달러 돌파 전망... IP 보호와 표준특허 확보 시급

국가 기술경쟁력의 열쇠, ‘특허 존중 사회’가 특허의 가치와 미래를 말하다

전기차 화재 막을 수 없나?... 특허기술 본 전기차 화재 예방 대책 방안은?

1인 가구 시대, 성장하는 간편식 시장... 특허기술도 증가

지구의 물 부족 문제 해결, 해수담수화가 답이다

최고의 지식재산 인재를 가린다... ‘2024 캠퍼스 특허 유니버시아드’ 시상식 개최

체코 원전, 웨스팅하우스의 특허권 분쟁 속 타결에 '탄력'... 이유는?

맛소금부터 의료기기까지, K-브랜드 보호에 민관 협력 강화

"반도체 장비 산업의 미래를 이끈다"... 특허청, 세메스(주)와 특허경쟁력 강화를 위한 현장 소통 간담회 개최

KAIST, 나노 분석 혁신! 미래 반도체 소재 측정 정확도 8배 향상

사이언스 많이 본 기사

AI로 신소재 설계 혁명... KAIST, 그린수소·배터리 촉매의 미래를 바꾸다

KAIST, 초박막 기술로 초고해상도 이미지 센서 시대 연다

고품질 오가노이드 대량 생산 기술 확보... 동물대체시험법·재생 치료제 개발 청신호

KAIST, 차세대 구조배터리 개발... 에너지 저장과 하중 지지를 동시에

따개비처럼 강력하고 아르마딜로처럼 유연하다... UNIST, 초강력 피부 접착 패치 개발

최신기사

[인사] 특허청

AI 보안 기술, 미래 경쟁력 '좌우'

특허청, 딥페이크 AI 현장에서 답을 찾다... 딥브레인AI 방문

"지식재산 경영이 성공의 열쇠다"... 충남 기업 경쟁력 강화 전략 공유

[인사] 특허청

한국특허신문사ㅣ제호: 특허뉴스 (月刊)ㅣ정기간행물 등록번호:서울강남 라01064ㅣ등록일: 2005년 4월6일
인터넷신문ㅣ제호: 특허TVㅣ등록번호:서울,아03336ㅣ등록·발행일: 2014년9월25일
발행소: 우(06132) 서울특별시 강남구 테헤란로 151(역삼동)ㅣ대표전화:02-2238-4345ㅣ팩스:02-2238-6769
발행/편집인: 이성용ㅣ청소년보호책임자: 이성용ㅣ뉴스제보: patentnews@naver.com
특허뉴스의 모든 컨텐츠(기사)는 저작권법의 보호를 받습니다. 무단 전재·복사·배포 등을 금지합니다.
Copyright ⓒ 2005 특허뉴스. All rights reserved.