본문 바로가기
1. SW 개발 & IT 트렌드

개발자들을 위한 오픈소스 LLM ‘ StarCoder 2’ 출시 소식

by soosun 2024. 3. 2.

빠르게 변화하고 있는 LLM 생태계에서, 코드를 생성해주는 LLM들에 대한 소식들도 종종 들려오고 있습니다.

개발에 활용 가능한 코드를 생성하는 LLM의 대표적인 사례들은 GitHub Copilot, StarCoder, Code-LLaMA 등인데,

 

개발을 지원하는 주요 LLM

 

GitHub Copilot이 가장 빠른 행보를 보이는 것 같지만 상용이며, 코드 수집 관련 라이선스 위반 의혹이 있다고 합니다.

오픈소스로 사용할수 있는 대표사례로 서비스나우, 허깅페이스 등이 협업하여 만든 StarCoder가 있습니다.

 

이번에 업그레이드된 'StarCoder 2’ 가 출시되었다는 소식이 있습니다.

아래 기사에 따르면, 서비스나우, 허깅페이스, 엔비디아 3개 회사가 공동 출시했다고 합니다.

GitHub Copilot의 좋은 대안이 될수 있을지 기대해봅니다. 

스타코더2는 서비스나우에서 학습한 30억 개의 파라미터 모델, 허깅페이스에서 학습한 70억 개의 파라미터 모델, 엔비디아에서 네모(NeMo) 프레임워크를 사용하여 구축한 150억 개의 파라미터 모델이라는 세 가지 LLM으로 구성되어 있다.

 

ㅇ 자세한 정보

https://github.com/bigcode-project/starcoder2

https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-foundation/models/starcoder2-15b

 

ㅇ [기사] “지원 코딩 언어 600여 개”··· 오픈소스 AI 코딩 LLM ‘스타코더2’ 출시

https://www.ciokorea.com/news/327473

 

“지원 코딩 언어 600여 개”··· 오픈소스 AI 코딩 LLM ‘스타코더2’ 출시

서비스나우, 허깅페이스, 엔비디아가 코드 생성에 특화된 오픈소스 LLM인 스타코더2(StarCoder2)를 28일 공동 출시했다. 

www.ciokorea.com

 

 Hugging Face StarCoder Blog

https://huggingface.co/blog/starcoder2

 

StarCoder2 and The Stack v2

StarCoder2 and The Stack v2 BigCode is releasing StarCoder2, the next generation of transparently trained open code LLMs. All StarCoder2 variants were trained on The Stack v2, a new large and high-quality code dataset. We release all models, datasets, and

huggingface.co

 

Hugging Face StarCoder

https://huggingface.co/bigcode/starcoder2-15b

 

bigcode/starcoder2-15b · Hugging Face

StarCoder2 Table of Contents Model Summary Use Limitations Training License Citation Model Summary StarCoder2-15B model is a 15B parameter model trained on 600+ programming languages from The Stack v2, with opt-out requests excluded. The model uses Grouped

huggingface.co

 

ㅇ etc

https://www.youtube.com/watch?v=xU7YVI1CAa4

https://www.youtube.com/watch?v=jFSLRpXJCyg&t=6s

https://www.youtube.com/watch?v=-bHuo6Fmh6I&t=2s

 

댓글