KAIST, 혁신적 AI 학습 기술로 비용 장벽 허물다... 스텔라트레인 개발

염현철 기자 | 기사입력 2024/09/20 [10:55]

KAIST, 혁신적 AI 학습 기술로 비용 장벽 허물다... 스텔라트레인 개발

염현철 기자 | 입력 : 2024/09/20 [10:55]

▲ 기존 저비용 분산 딥러닝 환경 모식도 / 기존 저비용 분산 딥러닝 환경에서는 네트워크 제약으로 인해 멀티 클러스터 및 하이브리드 클라우드 환경에서 학습 시 GPU 이용률이 저하되고, 학습 시간과 클라우드 비용이 증가하는 문제가 있다.(그림 및 설명=KAIST)  © 특허뉴스


KAIST가 고가의 데이터센터급 GPU와 초고속 네트워크 없이도 AI 모델을 효율적으로 학습할 수 있는 획기적인 기술을 선보였다. 이 기술은 자원이 제한된 연구자들과 중소기업들이 AI 연구를 더욱 가속화할 수 있도록 지원할 전망이다.

 

KAIST 전기및전자공학부 한동수 교수 연구팀은 19일, 일반 소비자용 GPU와 제한된 네트워크 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 '스텔라트레인(StellaTrain)' 프레임워크를 개발했다고 발표했다.

 

기존 AI 학습에는 고가의 서버급 GPU(예: 엔비디아 H100)와 고속 네트워크가 필수적이었다. 하지만 한 교수 연구팀은 저렴한 소비자용 GPU를 사용하고, 일반 인터넷 환경에서도 효율적인 분산 학습을 구현할 수 있는 기술을 개발했다. 이는 AI 연구의 접근성을 대폭 향상시켜 학계와 산업 전반에 큰 영향을 미칠 것으로 보인다.

 

스텔라트레인은 CPU와 GPU의 병렬 처리, 데이터 압축 및 전송 알고리즘 등을 적용해 네트워크 대역폭이 제한된 환경에서도 기존 데이터 병렬 학습보다 최대 104배 빠른 성능을 제공한다. 또한, AI 모델 학습 작업을 단계별로 분리해 효율성을 극대화하며, 원거리 분산 환경에서도 GPU 활용을 극대화할 수 있는 기술을 도입했다.

 

한동수 교수는 "이번 연구는 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있도록 만드는 중요한 진전"이라며 "앞으로도 저비용 환경에서의 AI 학습 기술 개발을 이어갈 것"이라고 밝혔다.

 

이번 연구는 UC 어바인 산기타 압두 조시 교수와 공동으로 진행됐으며, 성과는 ACM SIGCOMM 2024에서 발표됐다. 연구팀은 또한, 소수의 GPU로 거대 언어 모델을 학습할 수 있는 기술을 2024년 7월 발표하며 AI 분야의 새로운 지평을 열었다.

 

이 기사 좋아요
  • 도배방지 이미지

광고