GPU 메모리 최소·학습 65% 단축... 전북대 유서현 박사과정생, 생성형 AI로 ‘현장형 감염 대응’의 문을 열다

박진석 기자 | 기사입력 2025/09/30 [13:30]

GPU 메모리 최소·학습 65% 단축... 전북대 유서현 박사과정생, 생성형 AI로 ‘현장형 감염 대응’의 문을 열다

박진석 기자 | 입력 : 2025/09/30 [13:30]

▲ 사진=전북대  © 특허뉴스

 

의료 현장에서 감염 환자 대응은 ‘지금 이 순간’의 의사결정이 좌우한다. 하지만 병원 내 고성능 GPU 자원은 늘 부족하고, 한국어·영어가 뒤섞인 문서 환경도 모델 적용을 어렵게 만든다. 

 

전북대학교 조재혁 교수와 유서현 박사과정생(공대 소프트웨어공학과) 연구팀은 이런 병원 현실을 정면 겨냥해 GPU 메모리 사용을 최소화하면서도 정확도를 유지하는 의료 QA(질의응답) 특화 경량 학습 파이프라인을 제시했고, 실제로 학습 시간을 65% 단축해 국제 학계의 주목을 받았다. 이 성과로 연구팀은 최근 열린 국제학술대회 ‘Platform Technology and Service 2025(PlatCon-25)’에서 최우수논문상을 수상했다.

 

연구의 핵심은 QLoRA(Quantized Low-Rank Adaptation)와 FSDP(Fully Sharded Data Parallel)의 결합이다. 대형 언어모델(LLM)의 일부만 저비트로 정밀하게 학습하고, 분산 환경에서 파라미터를 조각내 효율적으로 처리함으로써 적은 GPU 메모리로도 임상 현장급 성능을 재현했다. 

 

유서현 박사과정생은 “의료 특화 LLM도 경량화와 효율성을 동시에 확보 가능하다”는 점을 실험으로 확인했으며, 이는 전원의 제약이 크거나 서버 자원이 제한된 병원 환경에서 특히 실용적이다.

 

적용 범위도 넓다. 한국어 의료 QA인 KorMedMCQA, 영어 의료 지식 평가셋 MedQA, 여기에 실제 병원 데이터(Asan-AMC Health Info)까지 포괄적으로 검증해 다국어·다도메인 환경과 실제 임상 맥락에서의 적용 가능성을 동시에 입증했다. 

 

조재혁 교수는 “한국어와 영어를 아우르는 의료 QA 모델의 임상 적용 가능성을 입증한 첫 사례”라며 “자원 제약이 큰 현장에서도 돌아가는 AI 연구를 확대하겠다”고 밝혔다.

 

이번 성과는 의료 감염 대응 흐름을 바꿀 실마리를 제공한다. 경량 학습 파이프라인을 통해 지침·진료기록·권고문헌 등 다국어 자료를 신속히 참조하고, 환자 상태에 맞춘 의사결정 지원(QA) 응답을 빠르게 제공함으로써 초기 진단·분류·격리 전략 수립을 앞당길 수 있다. 특히 GPU 확장이 어려운 중소병원이나 지방의료원에서의 활용 잠재력이 크다.

이 기사 좋아요
  • 도배방지 이미지

전북대, 생성형AI, 의료QA, 감염대응, QLoRA·FSDP, 다국어검증, 임상적용 관련기사목록
광고
광고
광고