본문 바로가기
1. SW 개발 & IT 트렌드

[기사] NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

by soosun 2024. 9. 22.
12일부터 시행...일각 "LLM 생태계 교란시키고 엔드 투 엔드 딜리버리 품질 하향 평준화" 비판 시각

NIA가 벤치마킹한 글로벌 ‘Open LLM 리더보드’를 운영 중인 허깅페이스도 지난 6월 6개 항목의 성능 평가로 구성한 새로 개편한 리더보드 시즌2를 공개한 바 있다. 

 

 

 

https://zdnet.co.kr/view/?no=20240813092358

 

NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

한국지능정보사회진흥원(NIA, 원장)은 업스테이지(대표 김성훈, 영어명 성킴)와 공동 운영하는 ‘Open Ko-LLM 리더보드’가 시즌2로 전면 개편했다고 12일 밝혔다. 추론능력, 감성, 무해성, 등 9개의

zdnet.co.kr

 

 

댓글