본문 바로가기

LLM7

개발자들을 위한 오픈소스 LLM ‘ StarCoder 2’ 출시 소식 빠르게 변화하고 있는 LLM 생태계에서, 코드를 생성해주는 LLM들에 대한 소식들도 종종 들려오고 있습니다. 개발에 활용 가능한 코드를 생성하는 LLM의 대표적인 사례들은 GitHub Copilot, StarCoder, Code-LLaMA 등인데, 개발을 지원하는 주요 LLM MS - GitHub Copilot (https://github.com/features/copilot) Hugging Face - StarCoder (https://huggingface.co/blog/starcoder2) Meta - Code-LLaMA (https://ai.meta.com/blog/code-llama-large-language-model-coding/) Google - Duet AI (https://cloud.go.. 2024. 3. 2.
[기사] “챗GPT가 스스로 운전한다?” 자율주행과 LLM의 결합 현주소 LLM이 비지니스 측면의 효과를 가지려면, 결국 이를 적용한 Use case가 많아야 할 것이다. 현실적으로 챗, Q&A, 요약 등 아주 일반적인 측면에서의 서비스로는 돈이 안된다는 것을 대부분 알고 있다. 다른 주요 도메인들에서의 Use case가 빠르게 도출되어야 하고, 아래는 자율주행 분야에서 시도되고 있는 흥미로운 사례에 대한 기사이다. ㅇ “챗GPT가 스스로 운전한다?” 자율주행과 LLM의 결합 현주소 https://www.itworld.co.kr/topnews/324029 “챗GPT가 스스로 운전한다?” 자율주행과 LLM의 결합 현주소 AI가 부상하면서 AI 모델의 크기도 커졌다. 이제는 100억 개의 매개변수를 사용하는 하나의 범용 모델이 다수의 작업을 해결하는 데 있어 탁월 www.itwo.. 2024. 2. 11.
[기사] 오픈AI 매출 폭증···작년 20억달러 돌파 LLM이 하루가 다르게 변화하고 있는 시점에 몇가지 LLM의 미래에 대한 트렌드를 엿 볼수 있는 기사들을 정리해본다. LLM의 발전이 기술적으로는 의미가 있으나, 결국 그 비지니스 측면의 효과에 대해서는 아직 많은 고민이 있는 것으로 알고 있다. 그러나 생각보다 빠르게 선두주자인 Open AI는 매출 효과도 어느정도 거두고 있는 것 같다. LLM이 시장에서 돈이 되느냐에 따라 결국 천문학적인 투자도 계속되고, 발전도 지속될수 있늘 것 같다. 다른 경쟁사들의 비지니스 전략은 어디로 향하고 그 효과는 어떨지 다들 궁굼해 하고 있을 것이다. [기사] 오픈AI 매출 폭증···작년 20억달러 돌파 https://zdnet.co.kr/view/?no=20240211104458 오픈AI 매출 폭증···작년 20억달러.. 2024. 2. 11.
Copilot with Bing - MS의 Open AI 기술을 이용하는 방법 최근 Microsoft Edge를 설치하고, 본인의 MS 계정에 로그인을 하면 Copilot을 무료로 사용할수 있게 되었다. Copilot with Bing 이라는 구성을 통해 MS는 Open AI 기술을 자사의 제품들에 적용하고, 경쟁력을 확보하는데 주력하고 있는 것이다. 아래 사례들 처럼, Microsoft Edge 브라우져를 통해 화면에 보는 것들은 무엇이든 Q&A, 요약 등의 작업을 처리할수 있다. 기사나 첨부 PDF 파일 등에 대한 내용 요약까지 가능하다. 또한 MS Designer 이라는 싸이트를 통해 이미지, 로고 등을 처리하는 기술도 공개하고 있다. 현재 일부 제한이 있으나 이미지와 관련된 대부분의 작업을 AI로 초리해주는 기능을 제공하고 있다. Image Creator, Design Cr.. 2024. 2. 5.
'Gemini 1.0': 고성능 멀티모달 모델(A Family of Highly Capable Multimodal Models) 구글 딥마인드의 새로운 발표, 각종 지표에서 우위에 있다는 발표를 했다. 진정한 강자는 누가 될 것이지, 새로운 다크호스의 등장을 기대하게 된다. 이제 서서히 시장에서의 경쟁도 치열해지고, 성공 모델이 나오게 되면 승자를 가릴때 까지의 승부는 장담할수 없는 상황까지 갈 것 같다. ㅇ 제미나이가 GPT-4 이겼다고?...마이크로소프트의 반격 https://zdnet.co.kr/view/?no=20231215104939 o 제미니 기술 보고서 'Gemini: 고성능 멀티모달 모델(Gemini: A Family of Highly Capable Multimodal Models) https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf o .. 2023. 12. 11.
메타가 개발한 대규모 언어 모델, ‘라마 2’란 무엇인가? ChatGPT가 촉발한 LLM의 전성시대에, 가장 주목받고 있는 라마 2에 대해 알아보자. 인공신경망 알고리즘은 크게, 합성곱 신경망(CNN), 순환 신경망(RNN), 트랜스포머(Transformer - 2017, 구글 논문 "Attention is all you need" 모델) 로 구분 - Transformer : Self-Attention 방식을 사용하는 모델로 문장 전체를 병렬구조로 번역할 뿐만 아니라, 멀리 있는 단어까지도 연관성을 만들어 유사성을 높였으며, RNN 한계를 극복 ‘라마 2(Llama 2)’는 페이스북 모회사 메타의 AI 그룹이 개발한 대규모 언어 모델(LLM)이다. 매개변수 규모에 따라 70억 개, 130억 개, 700억 개의 매개변수로 사전 학습 및 미세 조정된 3가지 모델이 .. 2023. 9. 20.
랭체인(LangChain) - LLM 사용을 편하게... 랭체인(LangChain)은 LLM 모델을 활용한 프로그램 개발을 위한 프레임워크로 파이썬과 타입스크립트, 자바스크립트 등 두 가지 언어를 지원한다. 관련하여 설명이 잘된 기사와 홈페이지를 링크한다. 아래 기사에 따르면 랭체인(LangChain)에는 다음 6개 모듈이 있다. 모델 I/O : 언어 모델과의 인터페이스 데이터 연결 : 애플리케이션별 데이터와의 인터페이스 체인 : 호출 시퀀스 구축 에이전트 : 상위 지시문이 주어지면 체인이 사용할 툴을 선택할 수 있도록 함 메모리 : 체인 실행 간에 애플리케이션 상태 유지 콜백 : 체인의 중간 단계를 기록 및 스트리밍 그런데 랭체인(LangChain) 소개 페이지 중에 흥미로운 것은, Retrieval 부분이다. 이 부분에 대해 좀더 확인을 해봐야 겠다. - .. 2023. 9. 14.