[기사] NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

12일부터 시행...일각 "LLM 생태계 교란시키고 엔드 투 엔드 딜리버리 품질 하향 평준화" 비판 시각

NIA가 벤치마킹한 글로벌 ‘Open LLM 리더보드’를 운영 중인 허깅페이스도 지난 6월 6개 항목의 성능 평가로 구성한 새로 개편한 리더보드 시즌2를 공개한 바 있다.

NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

한국지능정보사회진흥원(NIA, 원장)은 업스테이지(대표 김성훈, 영어명 성킴)와 공동 운영하는 ‘Open Ko-LLM 리더보드’가 시즌2로 전면 개편했다고 12일 밝혔다. 추론능력, 감성, 무해성, 등 9개의

zdnet.co.kr

[기사] "프로세스 자동화가 선두" 전 세계 IoT 혁신 사례 10선 (1)	2024.10.03
OpenAI o1-preview and o1-mini are rolling out today... (2)	2024.09.22
[기사] LLM보다 효율적… 빅테크들 `SLM 경쟁` (0)	2024.08.23
[강의 홍보] IoT 필수 지식 - 인프런 강의 홍보합니다. (0)	2024.07.08
[정보] 쿠버네티스 서비스 메시 ‘이스티오(Istio)’ 개념 다지기 (0)	2024.05.20

소소한 일상 soosun