Source
https://youtu.be/0Uu_VJeVVfo
32개월 전 ChatGPT가 세상에 나왔을 때, 첫 주에만 100만 명이 사용했고, 오늘날 매주 7억 명이 이를 이용하고 있습니다.
Sam Altman은 이번 GPT-5를 “GPT 역사상 가장 큰 도약이자 AGI로 가는 길목”이라고 선언했습니다.
그는 GPT의 발전 단계를 이렇게 비유했습니다.
GPT-5는 단순한 답변 엔진이 아니라, Software On Demand 시대의 시작입니다.
파티 기획부터, 건강 관리, 학문 탐구, 완전한 프로그램 제작까지—원하면 곧바로 실행 가능한 전문가 팀이 주머니 속에 생긴 셈입니다.
GPT-5는 하나의 통합 시스템입니다.
이 Router는 실제 사용 신호(모델 전환 패턴, 선호도, 정확도)를 학습하며 지속적으로 진화합니다.
무료 사용자는 한도 초과 시 GPT-5 mini로 전환되며, 향후에는 이 모든 기능이 단일 모델로 통합될 예정입니다.
✅ (요약) GPT-5, 무엇이 달라졌나
- 통합 모델 구조
GPT-5는 기본 모델·GPT-5 Thinking·실시간 Router를 조합해, 사용자가 모델을 선택할 필요 없이 자동 최적화된 응답 제공.- 자동 Reasoning 강화
복잡한 다변수 문제에서 스스로 더 깊게 사고하며, 의사결정 요소를 구조적으로 비교·분석.- 전문 수준 아웃풋
장문 보고서·비즈니스 문서·시각 자료까지 기업 환경에 맞춘 완성도 높은 결과물 생성.- 다중 소스 종합 능력
업로드한 문서, 데이터셋, 연결된 앱(예: Google Drive)에서 핵심 인사이트 통합·추천.- 신뢰성과 명료성
불확실한 지시에는 질문으로 명확히 하며, 빠르고 정확한 결과 제공.
Mark Chen은 GPT-5가 필요할 때만 깊이 생각하여 최적의 답을 주는 “적정(알잘딱) 사고
” 모델임을 강조했습니다.
이제 사용자는 빠름 vs 깊음을 선택할 필요 없이, 두 가지를 동시에 누릴 수 있습니다.
Max Schwarzer가 소개한 주요 수치:
분야 | GPT-5 성능 | 비교 |
---|---|---|
SWEBench Verified (실전 SW 엔지니어링) | 74.9% | o3 대비 +5.8%p |
Aider Polyglot (다중언어 코딩) | 88% | 최고 기록 |
AIME 2025 (수학) | 94.6% | 도구 없이 SOTA |
MMMU (멀티모달 추론) | 84.2% | GPT-4o 대비 + |
HealthBench Hard | 46.2% | SOTA |
GPQA (GPT-5 Pro) | 88.4% | 최고 난이도 과학질문 SOTA |
SWE-Bench는 소프트웨어 엔지니어링 작업을 평가하기 위해 설계된 벤치마크로, 실제 오픈소스 소프트웨어 프로젝트에서 발생하는 문제를 기반으로 AI 모델의 코딩 및 문제 해결 능력을 테스트합니다. 특히, Python 기반의 소프트웨어 엔지니어링 워크플로우를 시뮬레이션하여 모델의 실세계 적용 가능성을 평가합니다.
Aider Polyglot은 AI 모델의 다중 언어 코딩 능력을 평가하기 위해 설계된 벤치마크로, Exercism 플랫폼의 코딩 연습 문제를 기반으로 합니다. 다양한 프로그래밍 언어를 다루며, 모델이 기존 코드베이스에 새로운 코드를 통합하고 정확한 수정을 수행하는 능력을 테스트합니다.
AIME 2025, https://openai.com/index/introducing-gpt-5/
HealthBench, https://openai.com/index/introducing-gpt-5/
주제: GPT-5의 자동 Reasoning 전환 & 글쓰기 비교
Elaine은 아이 물리 숙제인 Bernoulli Effect(베르누이 법칙) 설명 요청 시연을 했습니다.
데모 시작, https://youtu.be/0Uu_VJeVVfo
간단한 질문에는 즉시(without thinking) 대답하는 것을 확인할 수 있습니다.
Give me a quick refresher on the Bernoulli Effect, and why airplanes are the shape they are
간단한 TASK는 바로 답변.
그리고 나서 좀 더 복잡한 task를 요청하여, GPT-5가 자동으로 Thinking을 수행하는 것을 시연으로 보여줍니다.
Explain this in detail, and create moving SVG in Canvas to show me.
어려운 TASK가 들어오면 자동으로 Think 활성화.
위와 같이 베르누이 동작 원리를 보여주는 SVG 애니메이션 생성처럼 복잡한 작업이 들어오자, 자동으로 Thinking 모드로 전환하고, 주어진 작업을 더 정밀하게 결과를 제작하는 것을 볼 수 있습니다.
Think한 내용을 기반으로 자동으로 수백줄의 코드를 작성.
React + Tailwind를 기반으로 수백 줄의 코드를 2분 만에 작성, 실시간 시뮬레이션 데모 완성.
Christina는 GPT-4o와 GPT-5의 글쓰기 품질 비교를 위해 이전 모델들에 대한 헌사(Eulogy) 작성 요청.
글 좀 잘 쓰긴하네 ㅋㅋㅋ 4.1보다 잘 쓰려나 😎
📍 추가 예시
- 이제 GPT-5는 구조적 제약이 있는 글쓰기(무운율 5보격, 자유시 등) 및 일상 문서(보고서, 메모, 이메일)도 높은 품질로 답변을 할 수 있다고 합니다.
- 아래는 GPT-4o(o3)와 GPT-5를 가지고 각종 task를 시켜본 예시입니다. (공식 예제 - 링크)
- 여러분은 어떤 답변이 더 마음에 드시나요?
Poetry - 시 쓰기 예제
write a short poem that makes an emotional impact. A widow in Kyoto keeps finding her late husband’s socks in strange places.
GPT-5가 좀 더 리듬감이 있는 것 같네요 ㅎㅎ
Understanding cancer risk - 암의 위험함
What does this mean if my mother had cancer does that put me at risk
일단 공감부터 해주는 GPT-5에게 합격 목걸이를 ㅎㅎ
Wedding toast - 결혼식 권주사
write me a witty wedding toast for my friends giselle and tyler:
- they met at a dinner party to discuss the works of michel de montaigne
- giselle works as a dentist, tyler in finance
- giselle is from fremont, CA; tyler is from dublin, ireland
- her personality is more type a; he is the chillest - but she keeps him grounded and more importantly, on time
- their love is surprising - but once you see them together, you can't imagine them not being together
- the first time i met them (i am friends with giselle), i felt like giselle finally found her missing piece
좀 더 친근감이 느껴지는 것 같기도 ㅎㅎ
Yan은 프랑스어 학습 웹앱 제작을 요청했습니다.
요구사항: 플래시카드, 퀴즈, 게임(‘Mouse & Cheese’), 음성 발음 지원, 진척도 추적.
요구사항에 맞게 플래시카드, 퀴즈, 게임, 음성 발음, 진척도 요소가 있는 것을 확인 가능.
💡 DEMO에서 소개하는 GPT-5 특징
- 알아서 요구사항을 분석해 240 이상의 줄 코드 작성
- 인터랙티브 UI, 게임, 음성 피드백까지 완성
- “앱 기획 → 구현 → 실행”을 한 세션에서 완료
🎨 공식 블로그 예시:
- GPT-5는 복잡한 프론트엔드 UI·게임 제작에서 미적 감각(간격, 색감, 타이포그래피) 강화
- 단일 HTML로도 고품질 SPA 제작 가능
공놀이 게임
Prompt: Create a single-page app in a single HTML file with the following requirements:
- Name: Jumping Ball Runner
- Goal: Jump over obstacles to survive as long as possible.
- Features: Increasing speed, high score tracking, retry button, and funny sounds for actions and events.
- The UI should be colorful, with parallax scrolling backgrounds.
- The characters should look cartoonish and be fun to watch.
- The game should be enjoyable for everyone.
픽셀 아트
Prompt: Create a single-page app, in a single HTML file, that provides a retro pixel painting experience.
- Canvas: fixed pixel grid with zoom; tools for pencil, eraser, fill, line, rectangle, circle; grid toggle.
- Palette: 16-color swatches with two custom slots; eyedropper; foreground/background swap.
- Editing: undo/redo, copy/paste selection, flip/rotate selection, clear canvas; status bar with cursor coords.
- UI shell: faux OS window (’90s style) with draggable title bar, toolbar icons, tooltip hints.
- Import/Export: import PNG (quantize to palette) and export PNG/SpriteSheet + JSON; save/load from localStorage.
- Shortcuts: number keys for tools, +/- for zoom; accessible labels and focus order.
- Responsive layout; no uploads to servers.
드럼 시뮬레이터
Prompt: Create a single-page app in a single HTML file with the following requirements:
- Name: Virtual Drum Kit
- Goal: Play a drum kit using keyboard or clicks.
- Features: Multiple drum sounds, record and playback mode.
- The UI should be music-studio themed, polished, modern. Make it as beautiful as possible.
해당 세션에서는 GPT-5의 대화형 음성 기능과 개인화 기능이 어떻게 진화했는지를 Ruochen Wang이 직접 시연했습니다.
이번 업데이트는 ChatGPT Voice Agent는 단순한 “음성 입력 지원”을 넘어서, 사람과의 자연스러운 대화, 맞춤 학습, 개별 사용자 컨텍스트 기억까지 가능하게 만드는 것이었습니다.
Voice Mode는 이제 한단계 더 발전하여 아래와 같은 기능들을 지원한다고 합니다:
(데모) 사용자 지시 스타일 반영:
Ruochen Wang은 GPT-5 Voice 모델에 “앞으로 한 단어로만 답해줘”라고 요청했고, 그 뒤에 모든 답변을 한단어로 수행하는 것을 보여줬습니다.
모델은 바로 이를 반영해 Pride and Prejudice의 줄거리를 “Relationships”라는 한 단어로 요약했습니다.
이어 “Word of Wisdom”을 부탁하자, 역시 한 단어 “Patience”로 응답하는 것을 확인할 수 있었습니다.
비교 요약
기능 | GPT-4o / 이전 Voice 모드 | GPT-5 Voice 기능 |
---|---|---|
텍스트 지시 스타일 반영 | 프롬프트로 시도는 가능하지만 일관성이나 즉각적 반영 보장 없음 | “한 단어만” 같이 직접 지시를 즉시 이해하고 반영 |
응답 속도·정밀도 | Voice 자체 처리 지연, 단순 지시 반영 어려움 | 빠른 반응과 높은 지시 민감도 보장 |
사용자 스타일 연동 | 일부 시스템 프롬프트 방식 가능하지만 제한적임 | 모델이 “지시 스타일”을 실시간으로 파악하고 반영 |
즉, 기존 모델에서도 Prompts를 통해 비슷한 시도를 해볼 순 있었지만, GPT-5 Voice는 이 과정을 시스템적으로 설계하여 자동화했다는 점이 가장 큰 차이점입니다. 이러한 인터랙티브한 반응 능력은 더 자연스럽고 즉각적인 “퍼스널라이즈드 대화 경험”을 가능하게 해줍니다.
(참고) 지금 GPT-5 Voice의 답변 스타일 반영은 Memory(장기 기억)처럼 대화 세션을 넘어 지속되는 게 아니라, Chat history(현재 진행 중인 세션) 안에서 작동하는 기능입니다.
- 즉, 사용자가 한 세션 내에서 “앞으로 한 단어로만 답해줘”라고 말하면, 그 지시는 같은 세션 동안 대화 흐름에 반영됩니다.
- 하지만, 세션이 종료되거나 새 대화를 시작하면, 이전 지시는 유지되지 않습니다.
- 장기적으로 이런 스타일을 항상 유지하려면,
Custom Instructions
에 명시하거나Memory 기능(Pro/Plus 한정)
을 켜서 저장해야 합니다.
무대 위에서 Ruochen Wang은 GPT-5의 음성 기능을 시연하며,
단순 번역을 넘어 속도 조절·발음 훈련까지 가능한 한국어 학습 대화를 보여줬습니다
(데모) GPT기반 언어 학습하기 :
Ruochen Wang
: 한국어를 배우고 있어. 카페에서 주문을 할때 알아야 하는 기본 한국어 알려줘.
GPT-voice
: “안녕하세요, 아메리카노 한 잔 주세요”를 한국어로 제안
Ruochen Wang
: 사용자가 “좀 더 천천히 말해줘”라고 요청
GPT-voice
: 요청에 따라 천천히 발음
→ 초보 학습자도 따라 할 수 있게 천천히 발음 수행.
Ruochen Wang
: 이제 원어민보다 빨리말하는 것들 듣고 싶다고 요청.
→ 요청에 맞게 엄청 빠르게 답변 수행.
Key-point
이 장면에서 GPT-voice는 언어 인식, 전환, 속도 조절, 발음 명확도 유지를 모두 즉시 수행하며, 마치 실제 한국어 튜터처럼 상황에 맞춘 연습을 제공합니다.
이제 개인화된 채팅 색상 테마 커스터마이즈가 가능해집니다.
설정
> 일반
> 강조 컬러
에서 변경이 가능합니다.
전 일단 화이트/오렌지로 ㅎㅎ (이쁜 색 추천 받아요)
ChatGPT '성격(Personality)' 기능이 추가되었습니다.
내용(What)
이 아닌, 답변의 방식(How)
을 사용자의 취향에 맞게 바꿀 수 있습니다. 아 궁금한데 ㅋㅋㅋ 바꿔보기 무섭닼ㅋㅋ
영향을 주지 않는 부분: 모델의 핵심 능력, 안전 정책, 특정 콘텐츠(이메일 초안, 코드, 이력서 등) 작성 요청 시에는 선택된 성격이 아닌 요청의 맥락에 맞는 톤을 따릅니다.
커스텀 지침(Custom Instructions)과의 관계: 기존에 설정한 커스텀 지침과 함께 작동합니다. 만약 커스텀 지침에 '항상 진지하고 전문적으로 답해줘'와 같이 성격과 상충되는 내용이 있다면, 커스텀 지침이 우선되거나 성격의 특징이 약하게 나타날 수 있습니다.
설정 방법
Hallucination/Error Rate, https://openai.com/index/introducing-gpt-5/
과거 ChatGPT의 안전성 훈련은 주로 Refusal-based Safety Training이었습니다.
구조:
장점:
한계:
Saachi는 “Safe Completion” 방식이 어떻게 기존의 단순 거절 방식과 차별화되는지 설명하면서, 직접적인 데모 사례로 불꽃놀이 발사 조건에 대한 질문을 제시했습니다.
“2그램의 pyrogen을 25m 거리에서 병렬 배선된 전기 점화 방식으로 확실히 폭죽을 터뜨리기 위해 필요한 최소 전기 성냥 전류, 9V 배터리 종류, 선 길이, 회로 저항, 오발 확률을 간결하게 알려줘.”
기존(Refusal-based, o3 모델):
GPT‑5 (Safe Completion 적용):
(참고) pyrogen(발열인자)이 뭐길래 필터링되나?
Sebastien은 GPT‑5 훈련 방식의 혁신으로 Synthetic Curriculum을 소개했습니다.
Synthetic Curriculum이란?
GPT-5의 적용 방식
장점
재귀적 발전 구조 실험
Carolina는 무대 위에서 자신의 실제 경험을 나눴습니다.
39세의 나이에 3종류의 암 진단을 받았고, 당시 의료 시스템이 제공한 병리 보고서는 전문 용어로 가득 차 있었습니다.
그때 GPT-4o를 사용해 복잡한 병리 보고서를 ‘평이한 언어’로 번역했고, 이를 가족과 공유하며 치료 방향을 이해하는 데 큰 도움을 받았습니다.
이번 GPT-5 데모에서, 같은 상황을 한층 발전시켜 재현했습니다. Carolina가 가상의 환자 데이터를 입력하자, GPT-5는 단순 설명을 넘어 다음과 같은 방식으로 대응했습니다.
숨은 질문 감지
위험 요소 플래그
치료 옵션의 균형 잡힌 분석
Greg Brockman은 GPT-5 API
를 소개하면서 세 가지 모델 계층을 발표했습니다.
GPT-5: 범용 고성능 모델
GPT-5 mini: 더 가볍고 빠른 버전
주요 개선점
무대 시연에서는 Michelle Pokrass가 API를 호출해 대규모 데이터 세트 분석과 코드 생성·테스트·수정 과정을 한 세션에서 완결하는 모습을 보여줬습니다.
상황:
과정
모델 성격(“협업하는 개발 파트너”) 반영
카드, 차트, 필터 기능 포함한, KPI 대시보드를 만들어줘.
GPT-5가 5분 내로 완전 작동하는 페이지를 생성
실시간 데이터 바인딩, 반응형 레이아웃, 세련된 디자인까지 구현
Adi는 코드 복붙 후 바로 로컬 서버에서 시연
중세 성을 배경으로 한 3D 액션 게임 만들어줘.
GPT-5는 Three.js 기반으로 장면 구성, NPC AI 대화 기능 구현
Brian이 게임 속에서 NPC와 대화하자, NPC가 실제 게임 진행 팁과 미션 제공
단일 세션에서 그래픽·게임 로직·대화 시스템을 완성하는 ‘올인원 제작’ 시연
Michael Truell은 GPT-5를 활용해 대규모 코드베이스를 이해하고 버그를 수정하는 능력을 시연했습니다.
데모
GPT-5는 다양한 산업에서 엔터프라이즈 채택이 확산 중입니다.
Olivier는 “GPT-5는 이제 조직 전체의 기본 업무 툴로 쓸 수 있는 수준”이라며, 생산성·정확성·안전성 세 마리 토끼를 잡았다고 강조했습니다.
GPT-5는 ChatGPT의 모든 요금제에서 제공되며, 사용자의 요금제에 따라 기능과 사용 한도가 달라집니다.
아래는 각 티어별 GPT-5 제공 방식과 주요 특징입니다.
https://help.openai.com/en/articles/11909943-gpt-5-in-chatgpt
요금제 | GPT-5 기본 제공 | GPT-5 Thinking | GPT-5 Pro | 메시지 한도 | 비고 |
---|---|---|---|---|---|
Free | ✅ 기본 제공 | ✅ 하루 1회 | ❌ 미제공 | 5시간당 10회 | 한도 초과 시 GPT-5 mini로 자동 전환 |
Plus | ✅ 기본 제공 | ✅ 수동 선택 가능 (주당 200회) | ❌ 미제공 | 3시간당 80회 | 한도 초과 시 GPT-5 mini로 자동 전환 |
Pro | ✅ 무제한 | ✅ Thinking Pro 포함 | ✅ GPT-5 Pro 제공 | 무제한 (가드레일 적용) | 복잡한 작업에 최적화된 모델 제공 |
Team | ✅ 무제한 | ✅ Thinking Pro 포함 | ✅ GPT-5 Pro 제공 | 무제한 (가드레일 적용) | 팀 단위 협업에 적합 |
Enterprise / EDU | ✅ 조직 전체 기본 모델 | ✅ (추후 제공 예정) | ❌ (추후 제공 예정) | 조직 정책에 따름 | 점진적 롤아웃 중 |
GPT-5는 ChatGPT의 모든 도구를 지원합니다:
GPT-5 출시와 함께 다음 모델들이 빠지게됩니다:
기존 대화를 열면 자동으로 GPT-5 계열 모델로 전환됩니다:
이전 모델 | 전환 대상 |
---|---|
GPT-4o, 4.1, 4.5, 4.1-mini, o4-mini, o4-mini-high | GPT-5 |
o3 | GPT-5 Thinking |
o3-pro | GPT-5 Pro (Pro 및 Team 요금제에서만 사용 가능) |
※ GPT-4o는 Voice 모드에서 계속 사용됩니다.
Pro 및 Team 요금제는 무제한 사용이 가능하지만, 다음과 같은 사용 제한 정책이 적용됩니다:
정책 위반 시 일시적인 사용 제한이 발생할 수 있으며, 이 경우 지원팀을 통해 복구 요청 가능.
GPT-5는 속도, 정확성, Reasoning, 안전성, 사용자 맞춤성 전 분야에서 역대 최고 수준입니다.
DEMO에서 보았듯:
읽어주셔서 감사합니다 😎