본문 바로가기

AI30

개발자들을 위한 오픈소스 LLM ‘ StarCoder 2’ 출시 소식 빠르게 변화하고 있는 LLM 생태계에서, 코드를 생성해주는 LLM들에 대한 소식들도 종종 들려오고 있습니다. 개발에 활용 가능한 코드를 생성하는 LLM의 대표적인 사례들은 GitHub Copilot, StarCoder, Code-LLaMA 등인데, 개발을 지원하는 주요 LLM MS - GitHub Copilot (https://github.com/features/copilot) Hugging Face - StarCoder (https://huggingface.co/blog/starcoder2) Meta - Code-LLaMA (https://ai.meta.com/blog/code-llama-large-language-model-coding/) Google - Duet AI (https://cloud.go.. 2024. 3. 2.
[기사] “챗GPT가 스스로 운전한다?” 자율주행과 LLM의 결합 현주소 LLM이 비지니스 측면의 효과를 가지려면, 결국 이를 적용한 Use case가 많아야 할 것이다. 현실적으로 챗, Q&A, 요약 등 아주 일반적인 측면에서의 서비스로는 돈이 안된다는 것을 대부분 알고 있다. 다른 주요 도메인들에서의 Use case가 빠르게 도출되어야 하고, 아래는 자율주행 분야에서 시도되고 있는 흥미로운 사례에 대한 기사이다. ㅇ “챗GPT가 스스로 운전한다?” 자율주행과 LLM의 결합 현주소 https://www.itworld.co.kr/topnews/324029 “챗GPT가 스스로 운전한다?” 자율주행과 LLM의 결합 현주소 AI가 부상하면서 AI 모델의 크기도 커졌다. 이제는 100억 개의 매개변수를 사용하는 하나의 범용 모델이 다수의 작업을 해결하는 데 있어 탁월 www.itwo.. 2024. 2. 11.
[기사] 오픈AI 매출 폭증···작년 20억달러 돌파 LLM이 하루가 다르게 변화하고 있는 시점에 몇가지 LLM의 미래에 대한 트렌드를 엿 볼수 있는 기사들을 정리해본다. LLM의 발전이 기술적으로는 의미가 있으나, 결국 그 비지니스 측면의 효과에 대해서는 아직 많은 고민이 있는 것으로 알고 있다. 그러나 생각보다 빠르게 선두주자인 Open AI는 매출 효과도 어느정도 거두고 있는 것 같다. LLM이 시장에서 돈이 되느냐에 따라 결국 천문학적인 투자도 계속되고, 발전도 지속될수 있늘 것 같다. 다른 경쟁사들의 비지니스 전략은 어디로 향하고 그 효과는 어떨지 다들 궁굼해 하고 있을 것이다. [기사] 오픈AI 매출 폭증···작년 20억달러 돌파 https://zdnet.co.kr/view/?no=20240211104458 오픈AI 매출 폭증···작년 20억달러.. 2024. 2. 11.
Copilot with Bing - MS의 Open AI 기술을 이용하는 방법 최근 Microsoft Edge를 설치하고, 본인의 MS 계정에 로그인을 하면 Copilot을 무료로 사용할수 있게 되었다. Copilot with Bing 이라는 구성을 통해 MS는 Open AI 기술을 자사의 제품들에 적용하고, 경쟁력을 확보하는데 주력하고 있는 것이다. 아래 사례들 처럼, Microsoft Edge 브라우져를 통해 화면에 보는 것들은 무엇이든 Q&A, 요약 등의 작업을 처리할수 있다. 기사나 첨부 PDF 파일 등에 대한 내용 요약까지 가능하다. 또한 MS Designer 이라는 싸이트를 통해 이미지, 로고 등을 처리하는 기술도 공개하고 있다. 현재 일부 제한이 있으나 이미지와 관련된 대부분의 작업을 AI로 초리해주는 기능을 제공하고 있다. Image Creator, Design Cr.. 2024. 2. 5.
'Gemini 1.0': 고성능 멀티모달 모델(A Family of Highly Capable Multimodal Models) 구글 딥마인드의 새로운 발표, 각종 지표에서 우위에 있다는 발표를 했다. 진정한 강자는 누가 될 것이지, 새로운 다크호스의 등장을 기대하게 된다. 이제 서서히 시장에서의 경쟁도 치열해지고, 성공 모델이 나오게 되면 승자를 가릴때 까지의 승부는 장담할수 없는 상황까지 갈 것 같다. ㅇ 제미나이가 GPT-4 이겼다고?...마이크로소프트의 반격 https://zdnet.co.kr/view/?no=20231215104939 o 제미니 기술 보고서 'Gemini: 고성능 멀티모달 모델(Gemini: A Family of Highly Capable Multimodal Models) https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf o .. 2023. 12. 11.
OpenAI 공지 : GPT-4 업데이트 - PDF 및 다양한 파일 처리 지원 OpenAI의 새로운 공지에 따르면, 이제 GPT-4에서 PDF 등 다양한 파일 처리 기능을 지원한다고 합니다. 이 부분이 어떤 의미를 갖는지, 왜 중요한지 아시는 분들에게는 희소식이 될 것이고 이제 본격적인 경쟁이 시작되는 것 같습니다. 이제 GPT-4는 최적의 모델을 선택하여 PDF 및 기타 다양한 파일을 처리할 수 있습니다. GPT-4 can now process PDFs and various other files selecting the optimal model. 2023. 10. 30.
메타가 개발한 대규모 언어 모델, ‘라마 2’란 무엇인가? ChatGPT가 촉발한 LLM의 전성시대에, 가장 주목받고 있는 라마 2에 대해 알아보자. 인공신경망 알고리즘은 크게, 합성곱 신경망(CNN), 순환 신경망(RNN), 트랜스포머(Transformer - 2017, 구글 논문 "Attention is all you need" 모델) 로 구분 - Transformer : Self-Attention 방식을 사용하는 모델로 문장 전체를 병렬구조로 번역할 뿐만 아니라, 멀리 있는 단어까지도 연관성을 만들어 유사성을 높였으며, RNN 한계를 극복 ‘라마 2(Llama 2)’는 페이스북 모회사 메타의 AI 그룹이 개발한 대규모 언어 모델(LLM)이다. 매개변수 규모에 따라 70억 개, 130억 개, 700억 개의 매개변수로 사전 학습 및 미세 조정된 3가지 모델이 .. 2023. 9. 20.
랭체인(LangChain) - LLM 사용을 편하게... 랭체인(LangChain)은 LLM 모델을 활용한 프로그램 개발을 위한 프레임워크로 파이썬과 타입스크립트, 자바스크립트 등 두 가지 언어를 지원한다. 관련하여 설명이 잘된 기사와 홈페이지를 링크한다. 아래 기사에 따르면 랭체인(LangChain)에는 다음 6개 모듈이 있다. 모델 I/O : 언어 모델과의 인터페이스 데이터 연결 : 애플리케이션별 데이터와의 인터페이스 체인 : 호출 시퀀스 구축 에이전트 : 상위 지시문이 주어지면 체인이 사용할 툴을 선택할 수 있도록 함 메모리 : 체인 실행 간에 애플리케이션 상태 유지 콜백 : 체인의 중간 단계를 기록 및 스트리밍 그런데 랭체인(LangChain) 소개 페이지 중에 흥미로운 것은, Retrieval 부분이다. 이 부분에 대해 좀더 확인을 해봐야 겠다. - .. 2023. 9. 14.
[기사] AI 시대의 개발자 경험, 무엇이 달라지고 어떻게 대처해야 하는가? 아마도 새로운 IT기술의 유행에 가장 난처한 사람들은 개발자들이 아닐까? 일반 사용자들이 핫한 트랜드에 반응할때, 개발자들은 이 것을 어떻게 학습해서 실제 업무에 반영할지 고민해야 하기때문이고, 또 이 트랜드를 준비 못해서 기술적으로 뒤처지면(ㅋㅋ 내 경쟁력, 즉 몸값이 떨어지면...) 어떻게하나 하는 아주 현실적인 문제도 있다.... 요즘 AI 때문에, 정확히는 Open AI가 쏘아올린 Generative AT 때문에 SW현장도 난리가 아니다. 이전에 여러 트랜드가 닥쳤을대도 그랬지만, 이럴때는 트랜드의 빅픽처를 바탕으로 이에 대한 준비와 활용을 어떻게 할지 이해하는 것이 중요하다. 개발자에게는 "일희일비 一喜一悲" 하지않고 "평정심 平靜心"을 지키며 한 걸음씩 나아가는 자세가 중요하다. 관련하여 읽어.. 2023. 7. 30.
 Raspberry Pi 재단, DeepMind 합작 - "Experience AI"프로그램 Raspberry Pi 재단과 DeepMind사의 협업을 통해 공동 개발한 AI 교육 프로그램이 오픈 되었다. "Experience AI"프로그램 ( https://experience-ai.org/ ) 레슨 프로그램 페이지에 가면 아래처럼 강의들이 체계적으로 준비되어 있다. Lesson 1: AI란 무엇입니까? Lesson 2: 컴퓨터가 데이터에서 학습하는 방법 Lesson 3: 바이어스 인 바이어스 아웃 Lesson 4: 의사 결정 트리 Lesson 5: ML 모델로 문제 해결 Lesson 6: 모델 카드 및 커리어 https://experience-ai.org/ Experience AI Young people need to understand AI and machine learning Artifici.. 2023. 6. 15.
대규모 언어 모델(LLM)의 문제들 - Hallucinations Large AI 에 대한 균형 잡힌 시각이 필요한 시점이다. LLM 모델의 문제를 논의할때 많은 사람들이 혼란을 겪을 수 있기대문에 합리적인 대화를 위해 특정 주제로 접근할수 밖에 없다. 그래서 가장 많이 논제로 등장하는 것이 "Hallucinations" 이고, 이에 대해 다양한 내용들을 살펴볼 필요가 있다. "대규모 언어 모델(LLM)은 2018년 Google AI 연구원 이 대중화한 개념인 Hallucinations 을 나타냅니다 . 이 맥락에서 Hallucinations 은 의미론적으로 또는 구문론적으로 타당하지만 실제로는 부정확하거나 무의미한 생성된 텍스트의 실수를 말합니다. 요컨대, 기계가 말하는 것을 신뢰할 수 없습니다." "언어는 우리 모두가 상식이라고 부르는 엄청난 양의 배경 지식 위에 .. 2023. 5. 30.
Generative AI 경쟁 관련 기사들 - ‘ChatGPT vs 빙 vs 바드’ Generative AI가 가장 핫한 요즘, 그 경쟁에 다가갈수 없어 아쉽긴 하지만, 한가지 흥미로운 것은 이제 누가 승자가 될까? 하는 것이다. 이런 경쟁이 수없이 반복되며, 기술 발달의 속도가 가속화되는 IT 분야의 성격을 볼때, 관심을 갖고 눈여겨 보아야 하는 주제이기도 하다. 어찌되었든 흥미로운 1라운드 정도는 아래 기사들 처럼 흐르고 있다고 한다..... 새로운 AI 챗봇 ‘ChatGPT’, ‘빙 챗(Bing Chat)’, ‘바드(Bard)’는 사람처럼 정보, 즐거움, 가르침을 제공하는 AI를 통해 일상생활에 일대 변혁을 가져올 것이라고 말한다. 이런 AI 챗봇이 과연 얼마나 좋은지 알아보기 위해 직접 테스트를 했다.-기사- https://www.itworld.co.kr/topnews/28499.. 2023. 4. 11.