LLM 편향 문제 해결·우수 한국어 성능 탑재
엔씨소프트는 거대언어모델(LLM)의 성능 및 수행능력 평가모델 'VARCO(바르코) Judge LLM'을 출시했다고 23일 밝혔다.
바르코 Judge LLM은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 평가하는 모델이다. 동급 모델 중 가장 높은 LLM 편향 문제해결 능력과 한국어 성능을 지녔다.
해당 평가모델을 사용하면 AI 모델 연구개발 기업은 자사 LLM의 성능 수준을 평가모델로 검증해 타 모델 대비 성능 우위를 증명하거나 취약점을 파악해 보강할 수 있다. 모델 허브 사업자는 LLM 선택-최적화-배포하는 과정을 가속화할 수 있다.
엔씨는 게임 개발 과정과 사내 업무 효율화 전반에 AI 기술을 적극 활용하고 있다. 이번 평가모델 출시를 통해 자체 LLM '바르코(VARCO)'의 품질 향상과 LLM 모델 평가 분야를 선도할 계획이다.
이연수 엔씨 리서치 본부장은 "빠르게 진화하는 AI 시장에서 산업에 맞는 최적의 모델을 선별하고 적용하는 서비스가 더욱 중요해지고 있다"며 "VARCO Judge LLM은 품질 향상을 넘어 AI 사업 필수 도구로 자리매김할 것"이라고 말했다.
ijs6846@shinailbo.co.kr
저작권자 © 신아일보 무단전재 및 재배포 금지