KAIST 전기및전자공학부 한동수 교수 연구팀은 19일, 일반 소비자용 GPU와 제한된 네트워크 환경에서도 AI 모델 학습을 수십에서 수백 배 가속할 수 있는 '스텔라트레인(StellaTrain)' 프레임워크를 개발했다고 발표했다.
기존 AI 학습에는 고가의 서버급 GPU(예: 엔비디아 H100)와 고속 네트워크가 필수적이었다. 하지만 한 교수 연구팀은 저렴한 소비자용 GPU를 사용하고, 일반 인터넷 환경에서도 효율적인 분산 학습을 구현할 수 있는 기술을 개발했다. 이는 AI 연구의 접근성을 대폭 향상시켜 학계와 산업 전반에 큰 영향을 미칠 것으로 보인다.
스텔라트레인은 CPU와 GPU의 병렬 처리, 데이터 압축 및 전송 알고리즘 등을 적용해 네트워크 대역폭이 제한된 환경에서도 기존 데이터 병렬 학습보다 최대 104배 빠른 성능을 제공한다. 또한, AI 모델 학습 작업을 단계별로 분리해 효율성을 극대화하며, 원거리 분산 환경에서도 GPU 활용을 극대화할 수 있는 기술을 도입했다.
한동수 교수는 "이번 연구는 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있도록 만드는 중요한 진전"이라며 "앞으로도 저비용 환경에서의 AI 학습 기술 개발을 이어갈 것"이라고 밝혔다.
이번 연구는 UC 어바인 산기타 압두 조시 교수와 공동으로 진행됐으며, 성과는 ACM SIGCOMM 2024에서 발표됐다. 연구팀은 또한, 소수의 GPU로 거대 언어 모델을 학습할 수 있는 기술을 2024년 7월 발표하며 AI 분야의 새로운 지평을 열었다.
이 기사 좋아요
<저작권자 ⓒ 특허뉴스 무단전재 및 재배포 금지>
댓글
스텔라트레인 관련기사목록
|
많이 본 기사
|