ES4 · S234분 등장
추론모델
추론모델
단순 CoT 프롬프팅이 아니라, 생각 과정 자체를 강화학습(RL)으로 학습한 모델 (o1·R1·Claude Thinking)
💊 약사 비유
처방전 보자마자 조제 말고, DUR 상호작용·신기능·연령 다 밟고 결론 내는 방식
📍 강의 슬라이드 참조
S4S23
추론모델
단순 CoT 프롬프팅이 아니라, 생각 과정 자체를 강화학습(RL)으로 학습한 모델 (o1·R1·Claude Thinking)
처방전 보자마자 조제 말고, DUR 상호작용·신기능·연령 다 밟고 결론 내는 방식