요즘 대세인 ChatGPT에게 평소 궁굼하던 것을 진지하게 물어 보았습니다.
음, 답변이 만족할만한 수준인지는 ....
그래도 자주 이용해보겟습니다.
ㅇ InstructGPT와 형제모델
- DL 언어 생성 모델
- from GPT3.5(by text & code)
- RLHF(Reinforcement Learning by Human Feedback)
. SFT(Supervised Fine-Tuning): 사람이 직접 가르치는 방식으로 추가학습을 한 것
. RM(Reword Model): 사람이 보상하는 방식
. PPO(Proximal Policy Optimization) Algorithm: 정책 강화학습 한 것
ㅇ ChatGPT
- InstructGPT와 동일
- 대화형 에이전트에 최적화하여 FT 한 것(Optimizing Language Models for Dialogue)
(많은 데이타를 사전에 학습하고, 추가로 어떤 목적에 맞추어 직은 데이타를 학습하는 것)
ㅇ ChatGPT
- Generative : 다음 단어를 예측방식으로 학습하는 것(문장을 구성하는 언어모델)
- Pre-trained : 많은 양의 데이타를 사전에 훕련/학습
- Transformer : 신경만에 기반한 인코더-디코더(디코더만 사용)
- ChatGPT : 대화할 수 있게 GPT를 FT 한 것
일반인을 위한 활용 가이드도 있네요. 출처: https://sdf.seoul.kr/research-report/2003
'1. SW 개발 & IT 트렌드' 카테고리의 다른 글
chatGPT 시대의 승자는 마이크로소프트? 코파일럿(Copilot) (0) | 2023.03.23 |
---|---|
GPT-4 공개, ChatGPT 보다 나아진 점은? (0) | 2023.03.16 |
[기사] '국내 개발자 왜 써?' 대기업도 눈 돌렸다 / SBS 8뉴스 (0) | 2023.02.28 |
API Gateway에 대한 여러글들 (0) | 2023.02.17 |
[기사] “나는 누구인가?” ChatGPT가 말하는 ChatGPT (0) | 2023.01.27 |
댓글