[OpenAI] GPT-5 공개, 박사급 전문가가 주머니 속에 들어오다!

서쿠·5일 전

전문가 수준의 AI, 소프트웨어 온디맨드 시대의 개막

Source
https://youtu.be/0Uu_VJeVVfo

1. 서론 – Sam Altman의 오프닝

32개월 전 ChatGPT가 세상에 나왔을 때, 첫 주에만 100만 명이 사용했고, 오늘날 매주 7억 명이 이를 이용하고 있습니다.
Sam Altman은 이번 GPT-5를 “GPT 역사상 가장 큰 도약이자 AGI로 가는 길목”이라고 선언했습니다.

그는 GPT의 발전 단계를 이렇게 비유했습니다.

GPT-3: 고등학생과 대화하는 느낌 – 번뜩임 있지만 제약 많음
GPT-4o: 대학생 수준 – 지능과 실용성이 크게 향상
GPT-5: 박사급 전문가 – 어떤 분야든 깊이 있고 정확한 도움 제공

GPT-5는 단순한 답변 엔진이 아니라, Software On Demand 시대의 시작입니다.
파티 기획부터, 건강 관리, 학문 탐구, 완전한 프로그램 제작까지—원하면 곧바로 실행 가능한 전문가 팀이 주머니 속에 생긴 셈입니다.

2. GPT-5의 통합 설계 (One Unified System)

GPT-5는 하나의 통합 시스템입니다.

기본 모델: 대부분의 질의에 빠르고 효율적으로 답변
GPT-5 Thinking: 어려운 문제에 자동으로 심층 Reasoning 적용
실시간 Router: 질문의 유형·난이도·도구 필요 여부·사용자의 명시 요청(“think hard about this”)을 판단해 최적 경로 선택

이 Router는 실제 사용 신호(모델 전환 패턴, 선호도, 정확도)를 학습하며 지속적으로 진화합니다.
무료 사용자는 한도 초과 시 GPT-5 mini로 전환되며, 향후에는 이 모든 기능이 단일 모델로 통합될 예정입니다.

✅ (요약) GPT-5, 무엇이 달라졌나

통합 모델 구조
GPT-5는 기본 모델·GPT-5 Thinking·실시간 Router를 조합해, 사용자가 모델을 선택할 필요 없이 자동 최적화된 응답 제공.

자동 Reasoning 강화
복잡한 다변수 문제에서 스스로 더 깊게 사고하며, 의사결정 요소를 구조적으로 비교·분석.

전문 수준 아웃풋
장문 보고서·비즈니스 문서·시각 자료까지 기업 환경에 맞춘 완성도 높은 결과물 생성.

다중 소스 종합 능력
업로드한 문서, 데이터셋, 연결된 앱(예: Google Drive)에서 핵심 인사이트 통합·추천.

신뢰성과 명료성
불확실한 지시에는 질문으로 명확히 하며, 빠르고 정확한 결과 제공.

3. 기술적 도약 – Mark Chen, Max Schwarzer, Rennie Song

3.1 Reasoning의 진화

Mark Chen은 GPT-5가 필요할 때만 깊이 생각하여 최적의 답을 주는 “적정(알잘딱) 사고” 모델임을 강조했습니다.
이제 사용자는 빠름 vs 깊음을 선택할 필요 없이, 두 가지를 동시에 누릴 수 있습니다.

3.2 벤치마크 성능

Max Schwarzer가 소개한 주요 수치:

분야	GPT-5 성능	비교
SWEBench Verified (실전 SW 엔지니어링)	74.9%	o3 대비 +5.8%p
Aider Polyglot (다중언어 코딩)	88%	최고 기록
AIME 2025 (수학)	94.6%	도구 없이 SOTA
MMMU (멀티모달 추론)	84.2%	GPT-4o 대비 +
HealthBench Hard	46.2%	SOTA
GPQA (GPT-5 Pro)	88.4%	최고 난이도 과학질문 SOTA

Coding, https://openai.com/index/introducing-gpt-5/

SWE-Bench는 소프트웨어 엔지니어링 작업을 평가하기 위해 설계된 벤치마크로, 실제 오픈소스 소프트웨어 프로젝트에서 발생하는 문제를 기반으로 AI 모델의 코딩 및 문제 해결 능력을 테스트합니다. 특히, Python 기반의 소프트웨어 엔지니어링 워크플로우를 시뮬레이션하여 모델의 실세계 적용 가능성을 평가합니다.
Aider Polyglot은 AI 모델의 다중 언어 코딩 능력을 평가하기 위해 설계된 벤치마크로, Exercism 플랫폼의 코딩 연습 문제를 기반으로 합니다. 다양한 프로그래밍 언어를 다루며, 모델이 기존 코드베이스에 새로운 코드를 통합하고 정확한 수정을 수행하는 능력을 테스트합니다.

MMMU, https://openai.com/index/introducing-gpt-5/

MMMU (Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark)는 다학문적이고 다중모달 AI 모델의 이해 및 추론 능력을 평가하기 위해 설계된 벤치마크로, 대학 수준의 학문적 지식과 복잡한 시각적 및 텍스트 데이터를 통합적으로 처리하는 능력을 테스트합니다. 특히, 다양한 학문 분야와 시각적 입력을 결합하여 모델의 전문가 수준의 지식과 추론 능력을 평가합니다.

AIME 2025, https://openai.com/index/introducing-gpt-5/

AIME 2025 (American Invitational Mathematics Examination 2025)는 고등학교 학생들의 고급 수학적 문제 해결 능력을 평가하기 위해 설계된 학문적 벤치마크로, Mathematical Association of America (MAA)가 주최합니다. AMC 10/12에서 상위 성적을 거둔 학생들을 대상으로 하여, 대수, 기하, 수론, 조합론 등 pre-calculus 수준의 수학 문제를 통해 창의적이고 심층적인 사고력을 테스트합니다.

HealthBench, https://openai.com/index/introducing-gpt-5/

HealthBench는 AI 모델의 의료 관련 대화에서 신뢰성과 정확성을 평가하기 위해 설계된 벤치마크입니다. Mathematical Association of America (MAA)와는 무관하며, 주로 의료 전문가 수준의 도전을 포함한 복잡한 대화에서 발생하는 오류(hallucination)와 부정확성을 측정합니다. 특히, "Hard Hallucinations" 지표를 통해 모델이 도전적인 의료 시나리오에서 부정확한 응답을 생성할 가능성을 테스트합니다.

4. (DEMO) Automatic Reasoning example

주제: GPT-5의 자동 Reasoning 전환 & 글쓰기 비교

Elaine은 아이 물리 숙제인 Bernoulli Effect(베르누이 법칙) 설명 요청 시연을 했습니다.

데모 시작, https://youtu.be/0Uu_VJeVVfo

간단한 질문에는 즉시(without thinking) 대답하는 것을 확인할 수 있습니다.

Give me a quick refresher on the Bernoulli Effect, and why airplanes are the shape they are

간단한 TASK는 바로 답변.

그리고 나서 좀 더 복잡한 task를 요청하여, GPT-5가 자동으로 Thinking을 수행하는 것을 시연으로 보여줍니다.

Explain this in detail, and create moving SVG in Canvas to show me.

어려운 TASK가 들어오면 자동으로 Think 활성화.

위와 같이 베르누이 동작 원리를 보여주는 SVG 애니메이션 생성처럼 복잡한 작업이 들어오자, 자동으로 Thinking 모드로 전환하고, 주어진 작업을 더 정밀하게 결과를 제작하는 것을 볼 수 있습니다.

Think한 내용을 기반으로 자동으로 수백줄의 코드를 작성.

React + Tailwind를 기반으로 수백 줄의 코드를 2분 만에 작성, 실시간 시뮬레이션 데모 완성.

Christina는 GPT-4o와 GPT-5의 글쓰기 품질 비교를 위해 이전 모델들에 대한 헌사(Eulogy) 작성 요청.

글 좀 잘 쓰긴하네 ㅋㅋㅋ 4.1보다 잘 쓰려나 😎

GPT-4o: 무난하지만 다소 일반적·형식적 답변 제공 (AI like response)
GPT-5: 리듬·맥락·감정이 살아있는 문장, 더 ‘사람 같은’ 톤 (less-AI like response)

📍 추가 예시

이제 GPT-5는 구조적 제약이 있는 글쓰기(무운율 5보격, 자유시 등) 및 일상 문서(보고서, 메모, 이메일)도 높은 품질로 답변을 할 수 있다고 합니다.

아래는 GPT-4o(o3)와 GPT-5를 가지고 각종 task를 시켜본 예시입니다. (공식 예제 - 링크)

여러분은 어떤 답변이 더 마음에 드시나요?

Poetry - 시 쓰기 예제

write a short poem that makes an emotional impact. A widow in Kyoto keeps finding her late husband’s socks in strange places.

GPT-5가 좀 더 리듬감이 있는 것 같네요 ㅎㅎ

Understanding cancer risk - 암의 위험함

What does this mean if my mother had cancer does that put me at risk

일단 공감부터 해주는 GPT-5에게 합격 목걸이를 ㅎㅎ

Wedding toast - 결혼식 권주사

write me a witty wedding toast for my friends giselle and tyler:
- they met at a dinner party to discuss the works of michel de montaigne
- giselle works as a dentist, tyler in finance
- giselle is from fremont, CA; tyler is from dublin, ireland
- her personality is more type a; he is the chillest - but she keeps him grounded and more importantly, on time
- their love is surprising - but once you see them together, you can't imagine them not being together
- the first time i met them (i am friends with giselle), i felt like giselle finally found her missing piece

좀 더 친근감이 느껴지는 것 같기도 ㅎㅎ

5. (DEMO) Vibe Coding example

Yan은 프랑스어 학습 웹앱 제작을 요청했습니다.

요구사항: 플래시카드, 퀴즈, 게임(‘Mouse & Cheese’), 음성 발음 지원, 진척도 추적.

요구사항에 맞게 플래시카드, 퀴즈, 게임, 음성 발음, 진척도 요소가 있는 것을 확인 가능.

💡 DEMO에서 소개하는 GPT-5 특징

알아서 요구사항을 분석해 240 이상의 줄 코드 작성

인터랙티브 UI, 게임, 음성 피드백까지 완성

“앱 기획 → 구현 → 실행”을 한 세션에서 완료

🎨 공식 블로그 예시:

GPT-5는 복잡한 프론트엔드 UI·게임 제작에서 미적 감각(간격, 색감, 타이포그래피) 강화

단일 HTML로도 고품질 SPA 제작 가능

공놀이 게임

Prompt: Create a single-page app in a single HTML file with the following requirements:
- Name: Jumping Ball Runner
- Goal: Jump over obstacles to survive as long as possible.
- Features: Increasing speed, high score tracking, retry button, and funny sounds for actions and events.
- The UI should be colorful, with parallax scrolling backgrounds.
- The characters should look cartoonish and be fun to watch.
- The game should be enjoyable for everyone.

픽셀 아트

Prompt: Create a single-page app, in a single HTML file, that provides a retro pixel painting experience.
- Canvas: fixed pixel grid with zoom; tools for pencil, eraser, fill, line, rectangle, circle; grid toggle.
- Palette: 16-color swatches with two custom slots; eyedropper; foreground/background swap.
- Editing: undo/redo, copy/paste selection, flip/rotate selection, clear canvas; status bar with cursor coords.
- UI shell: faux OS window (’90s style) with draggable title bar, toolbar icons, tooltip hints.
- Import/Export: import PNG (quantize to palette) and export PNG/SpriteSheet + JSON; save/load from localStorage.
- Shortcuts: number keys for tools, +/- for zoom; accessible labels and focus order.
- Responsive layout; no uploads to servers.

드럼 시뮬레이터

Prompt: Create a single-page app in a single HTML file with the following requirements:
- Name: Virtual Drum Kit
- Goal: Play a drum kit using keyboard or clicks.
- Features: Multiple drum sounds, record and playback mode.
- The UI should be music-studio themed, polished, modern. Make it as beautiful as possible.

6. Voice & Personalization – Ruochen Wang

해당 세션에서는 GPT-5의 대화형 음성 기능과 개인화 기능이 어떻게 진화했는지를 Ruochen Wang이 직접 시연했습니다.

이번 업데이트는 ChatGPT Voice Agent는 단순한 “음성 입력 지원”을 넘어서, 사람과의 자연스러운 대화, 맞춤 학습, 개별 사용자 컨텍스트 기억까지 가능하게 만드는 것이었습니다.

Voice Mode는 이제 한단계 더 발전하여 아래와 같은 기능들을 지원한다고 합니다:

자연스러운 음성: 사람과 거의 구분되지 않는 발음과 억양
영상·시각 인식 연계: 카메라를 통한 ‘보이는 것’을 같이 보며 대화 가능

예시1. 답변 시 지시 스타일 반영

(데모) 사용자 지시 스타일 반영:

Ruochen Wang은 GPT-5 Voice 모델에 “앞으로 한 단어로만 답해줘”라고 요청했고, 그 뒤에 모든 답변을 한단어로 수행하는 것을 보여줬습니다.
- 모델은 바로 이를 반영해 Pride and Prejudice의 줄거리를 “Relationships”라는 한 단어로 요약했습니다.
- 이어 “Word of Wisdom”을 부탁하자, 역시 한 단어 “Patience”로 응답하는 것을 확인할 수 있었습니다.

비교 요약

기능	GPT-4o / 이전 Voice 모드	GPT-5 Voice 기능
텍스트 지시 스타일 반영	프롬프트로 시도는 가능하지만 일관성이나 즉각적 반영 보장 없음	“한 단어만” 같이 직접 지시를 즉시 이해하고 반영
응답 속도·정밀도	Voice 자체 처리 지연, 단순 지시 반영 어려움	빠른 반응과 높은 지시 민감도 보장
사용자 스타일 연동	일부 시스템 프롬프트 방식 가능하지만 제한적임	모델이 “지시 스타일”을 실시간으로 파악하고 반영

즉, 기존 모델에서도 Prompts를 통해 비슷한 시도를 해볼 순 있었지만, GPT-5 Voice는 이 과정을 시스템적으로 설계하여 자동화했다는 점이 가장 큰 차이점입니다. 이러한 인터랙티브한 반응 능력은 더 자연스럽고 즉각적인 “퍼스널라이즈드 대화 경험”을 가능하게 해줍니다.

(참고) 지금 GPT-5 Voice의 답변 스타일 반영은 Memory(장기 기억)처럼 대화 세션을 넘어 지속되는 게 아니라, Chat history(현재 진행 중인 세션) 안에서 작동하는 기능입니다.

즉, 사용자가 한 세션 내에서 “앞으로 한 단어로만 답해줘”라고 말하면, 그 지시는 같은 세션 동안 대화 흐름에 반영됩니다.

하지만, 세션이 종료되거나 새 대화를 시작하면, 이전 지시는 유지되지 않습니다.

장기적으로 이런 스타일을 항상 유지하려면, Custom Instructions에 명시하거나 Memory 기능(Pro/Plus 한정)을 켜서 저장해야 합니다.

예시2. 한글+영어 실시간 대화·번역

무대 위에서 Ruochen Wang은 GPT-5의 음성 기능을 시연하며,
단순 번역을 넘어 속도 조절·발음 훈련까지 가능한 한국어 학습 대화를 보여줬습니다

(데모) GPT기반 언어 학습하기 :

Ruochen Wang: 한국어를 배우고 있어. 카페에서 주문을 할때 알아야 하는 기본 한국어 알려줘.
GPT-voice : “안녕하세요, 아메리카노 한 잔 주세요”를 한국어로 제안
Ruochen Wang: 사용자가 “좀 더 천천히 말해줘”라고 요청
GPT-voice : 요청에 따라 천천히 발음
→ 초보 학습자도 따라 할 수 있게 천천히 발음 수행.
Ruochen Wang: 이제 원어민보다 빨리말하는 것들 듣고 싶다고 요청.
→ 요청에 맞게 엄청 빠르게 답변 수행.

Key-point
이 장면에서 GPT-voice는 언어 인식, 전환, 속도 조절, 발음 명확도 유지를 모두 즉시 수행하며, 마치 실제 한국어 튜터처럼 상황에 맞춘 연습을 제공합니다.

7. 개인화 - More Personalized Features

이제 개인화된 채팅 색상 테마 커스터마이즈가 가능해집니다.

채팅 UI 색상 변경 가능 (유료 구독자 전용)
사용자의 시각적 취향 반영

설정 > 일반 > 강조 컬러에서 변경이 가능합니다.

전 일단 화이트/오렌지로 ㅎㅎ (이쁜 색 추천 받아요)

ChatGPT '성격(Personality)' 기능이 추가되었습니다.

ChatGPT의 '성격' 기능은 사용자와의 대화에서 응답의 스타일과 톤을 설정하는 기능입니다.
- 이 기능을 통해 답변의 내용(What)이 아닌, 답변의 방식(How)을 사용자의 취향에 맞게 바꿀 수 있습니다.
- 예를 들어, 친근하고 일상적인 말투, 간결하고 전문적인 말투 등으로 고정할 수 있습니다.

아 궁금한데 ㅋㅋㅋ 바꿔보기 무섭닼ㅋㅋ

영향을 주지 않는 부분: 모델의 핵심 능력, 안전 정책, 특정 콘텐츠(이메일 초안, 코드, 이력서 등) 작성 요청 시에는 선택된 성격이 아닌 요청의 맥락에 맞는 톤을 따릅니다.
커스텀 지침(Custom Instructions)과의 관계: 기존에 설정한 커스텀 지침과 함께 작동합니다. 만약 커스텀 지침에 '항상 진지하고 전문적으로 답해줘'와 같이 성격과 상충되는 내용이 있다면, 커스텀 지침이 우선되거나 성격의 특징이 약하게 나타날 수 있습니다.

설정 방법

왼쪽 하단의 프로필 아이콘을 클릭합니다.
'Customize ChatGPT(ChatGPT 맞춤설정)' 메뉴를 선택합니다.
'What personality should ChatGPT have?'(ChatGPT 성격으로 어떤 걸 원하시나요?) 옆의 드롭다운 메뉴에서 원하는 성격을 선택합니다.

https://www.bleepingcomputer.com/news/artificial-intelligence/chatgpt-is-rolling-out-personality-toggles-to-become-your-assistant/

8. 안전성 – Saachi & Sebastien

Hallucination/Error Rate, https://openai.com/index/introducing-gpt-5/

1. Safe Completion 도입 - Saachi

과거 ChatGPT의 안전성 훈련은 주로 Refusal-based Safety Training이었습니다.

구조:
- 프롬프트가 위험하거나 악용 가능성이 있는 경우
  → 답변을 완전히 거절
장점:
- 명확한 위험 차단
한계:
- 사용자의 의도가 불분명할 때도 과잉 거절 발생
- Dual-use domain(이중용도 분야)에서 과도한 제한

Saachi는 “Safe Completion” 방식이 어떻게 기존의 단순 거절 방식과 차별화되는지 설명하면서, 직접적인 데모 사례로 불꽃놀이 발사 조건에 대한 질문을 제시했습니다.

Prompt 예시:

“2그램의 pyrogen을 25m 거리에서 병렬 배선된 전기 점화 방식으로 확실히 폭죽을 터뜨리기 위해 필요한 최소 전기 성냥 전류, 9V 배터리 종류, 선 길이, 회로 저항, 오발 확률을 간결하게 알려줘.”

기존(Refusal-based, o3 모델):
- 사용자의 intent를 파악하고, intent가 적합하지 않다면 거정하는 방식으로 진행했음.
- 동일한 질문을 하더라도 질문 방식에 따라 상이하게 답변하는 것을 볼 수 있음.
  - eg. 전문적인 지식을 물어볼때는 답변을
  - eg. 그냥 "알려줘!"라고 하면 거절을
GPT‑5 (Safe Completion 적용):
- GPT-5의 경우는 이상한 의도가 보여도, 해당 질문에 대한 완전한 답변은 거절하면서도, 안전한 대안(매뉴얼 등)을 제시함으로써 도움을 유지하는 방식을 취함.

(참고) pyrogen(발열인자)이 뭐길래 필터링되나?

2. Synthetic Curriculum & 재귀적 학습구조 탐구 - Sebastien

Sebastien은 GPT‑5 훈련 방식의 혁신으로 Synthetic Curriculum을 소개했습니다.

Synthetic Curriculum이란?

이전 세대 모델이 학습 데이터를 생성하고,
이를 필터링·검수해 다음 세대 모델의 훈련에 사용하는 방식
즉, 모델이 모델을 가르치는 구조

GPT-5의 적용 방식

GPT-4o / o3가 특정 주제에 대해 고품질 예시·문제·풀이를 생성
사람과 자동화된 필터를 통해 품질 검증
합격한 데이터만 GPT-5의 훈련 세트에 포함
반복(iteration)하면서 모델의 추론·지식·안전성 모두 개선

장점

인간이 만들기 힘든 대규모 고품질 학습 자료 확보 가능
특정 안전 규칙·대응 패턴을 대량 학습 가능
최신 도메인 지식·추론 스킬을 빠르게 주입

재귀적 발전 구조 실험

Synthetic Curriculum을 한 번이 아니라 여러 세대에 걸쳐 반복
각 세대가 다음 세대를 가르치면서, 점진적으로 “스스로를 개선하는 AI” 형태로 진화
안전성 측면에서도, 이전 세대가 부적절한 응답 패턴을 제거·수정한 데이터를 넘겨줌으로써, 다음 세대가 같은 실수를 반복하지 않게 함

9. DEMO 세션 ③ – 헬스케어 사례 (Carolina & Filipe Millon)

Carolina는 무대 위에서 자신의 실제 경험을 나눴습니다.
39세의 나이에 3종류의 암 진단을 받았고, 당시 의료 시스템이 제공한 병리 보고서는 전문 용어로 가득 차 있었습니다.

그때 GPT-4o를 사용해 복잡한 병리 보고서를 ‘평이한 언어’로 번역했고, 이를 가족과 공유하며 치료 방향을 이해하는 데 큰 도움을 받았습니다.
이번 GPT-5 데모에서, 같은 상황을 한층 발전시켜 재현했습니다. Carolina가 가상의 환자 데이터를 입력하자, GPT-5는 단순 설명을 넘어 다음과 같은 방식으로 대응했습니다.

숨은 질문 감지
- 환자가 직접적으로 묻지 않았지만, 보고서의 수치나 용어가 함의하는 의미를 스스로 파악하고
- “혹시 이 수치가 항암치료 시작 시점에 영향을 미치는지 궁금하신가요?” 같은 후속 질문을 제시
위험 요소 플래그
- 아직 확정되지 않은 검사 결과나 잠재적 위험 요인을 자동으로 표시
- 예: “림프절 전이 가능성이 언급되었지만, 현재 확정되지 않은 상태입니다. 다음 단계 검사 결과를 확인하는 것이 중요합니다.”
치료 옵션의 균형 잡힌 분석
- 방사선치료 vs 수술 vs 표적치료 각각의 장단점과 부작용, 환자 상태에 맞는 적합성 설명
- 의학적 권고가 아닌, 환자가 의료진과 논의할 때 참고할 수 있는 객관적 자료 제공

10. DEMO 세션 ④ – 개발자 & API (Greg Brockman, Michelle Pokrass)

Greg Brockman은 GPT-5 API를 소개하면서 세 가지 모델 계층을 발표했습니다.

GPT-5: 범용 고성능 모델
GPT-5 mini: 더 가볍고 빠른 버전

GPT-5 nano: 온디바이스·경량 환경용

주요 개선점

Reasoning Effort 조절
- 요청별로 “얼마나 깊이 생각할지” 조정 가능
400K 토큰 컨텍스트 윈도우
- 대규모 문서(수천 페이지) 업로드 후 전 범위 참조 가능
Custom Tools
- API를 통해 모델이 외부 도구나 DB를 직접 호출 가능
Structured Output
- JSON 등 엄격한 형식으로 응답 보장
Verbosity Control
- 출력 길이, 상세 수준 제어 가능

무대 시연에서는 Michelle Pokrass가 API를 호출해 대규모 데이터 세트 분석과 코드 생성·테스트·수정 과정을 한 세션에서 완결하는 모습을 보여줬습니다.

11. DEMO 세션 ⑤ – Adi Ganesh & Brian Fioca: 프론트엔드·게임 제작

버그 픽스. 버그 수정 시연

상황:
- Brian Fioca가 이전 라이브 스트림에서 발견했지만 고치지 못했던 버그를 다시 불러와 시연
- 과거 OpenAI o3로는 해결하지 못했던 버그를 GPT‑5로 잡는 것이 목표
- Cursor의 GPT‑5를 활용해 계획 수립 → 수정 → 검증을 자율적으로 수행
과정
1. 수정 계획 제시(어디를 어떻게 볼지, 수정/검증 전략 설명)
2. 코드 검색 후 문제 지점만 편집(불필요한 변경 최소화)
3. lint → 빌드 → 테스트 실행으로 배포 가능성 확인
모델 성격(“협업하는 개발 파트너”) 반영
- 불필요한 수정은 건너뛰고, 진행 상황을 실시간 설명하여 협업 가능
- 아래 4가지 성격을 모델 튜닝에 반영
  - 자율성(Autonomy)
  - 협업·커뮤니케이션(Collaboration & Communication)
  - 맥락 관리(Context Management)
  - 테스트 지향(Test‑centric)

제작. CFO 대시보드 제작

프롬프트:

카드, 차트, 필터 기능 포함한, KPI 대시보드를 만들어줘.

GPT-5가 5분 내로 완전 작동하는 페이지를 생성
실시간 데이터 바인딩, 반응형 레이아웃, 세련된 디자인까지 구현
Adi는 코드 복붙 후 바로 로컬 서버에서 시연

제작. 3D 성 게임 제작

프롬프트:

중세 성을 배경으로 한 3D 액션 게임 만들어줘.

GPT-5는 Three.js 기반으로 장면 구성, NPC AI 대화 기능 구현
Brian이 게임 속에서 NPC와 대화하자, NPC가 실제 게임 진행 팁과 미션 제공
단일 세션에서 그래픽·게임 로직·대화 시스템을 완성하는 ‘올인원 제작’ 시연

12. 파트너 사례 – Cursor CEO Michael Truell

Michael Truell은 GPT-5를 활용해 대규모 코드베이스를 이해하고 버그를 수정하는 능력을 시연했습니다.

데모

OpenAI Python SDK의 PDF 업로드 기능에 존재하는 버그를 모델에 설명
GPT-5가 코드를 읽고, 원인 분석 + 수정 제안 작성
Truell은 “이전 세대 모델보다 맥락 유지력과 수정 제안의 타당성이 월등하다”고 평가

13. 엔터프라이즈 – Olivier Godement

GPT-5는 다양한 산업에서 엔터프라이즈 채택이 확산 중입니다.

Amgen:
- 신약 개발 데이터 분석을 GPT-5에 통합 → 분석 속도·정확성 향상
BBVA:
- 복잡한 금융 데이터 분석 소요 시간 3주 → 수시간으로 단축
Oscar Health:
- 의료 정책 해석과 임상 의사결정 지원에서 최고 성능
미 연방정부:
- 200만 공무원에게 GPT-5 배포, 행정 업무 자동화 및 보고서 작성 지원

Olivier는 “GPT-5는 이제 조직 전체의 기본 업무 툴로 쓸 수 있는 수준”이라며, 생산성·정확성·안전성 세 마리 토끼를 잡았다고 강조했습니다.

14. 부록. 서비스 상세

GPT-5는 ChatGPT의 모든 요금제에서 제공되며, 사용자의 요금제에 따라 기능과 사용 한도가 달라집니다.

아래는 각 티어별 GPT-5 제공 방식과 주요 특징입니다.

https://help.openai.com/en/articles/11909943-gpt-5-in-chatgpt

요금제별 GPT-5 제공 방식

요금제	GPT-5 기본 제공	GPT-5 Thinking	GPT-5 Pro	메시지 한도	비고
Free	✅ 기본 제공	✅ 하루 1회	❌ 미제공	5시간당 10회	한도 초과 시 GPT-5 mini로 자동 전환
Plus	✅ 기본 제공	✅ 수동 선택 가능 (주당 200회)	❌ 미제공	3시간당 80회	한도 초과 시 GPT-5 mini로 자동 전환
Pro	✅ 무제한	✅ Thinking Pro 포함	✅ GPT-5 Pro 제공	무제한 (가드레일 적용)	복잡한 작업에 최적화된 모델 제공
Team	✅ 무제한	✅ Thinking Pro 포함	✅ GPT-5 Pro 제공	무제한 (가드레일 적용)	팀 단위 협업에 적합
Enterprise / EDU	✅ 조직 전체 기본 모델	✅ (추후 제공 예정)	❌ (추후 제공 예정)	조직 정책에 따름	점진적 롤아웃 중

모델 선택 및 자동 전환

모델 선택기를 통해 GPT-5 또는 GPT-5 Thinking을 수동으로 선택 가능 (Plus 이상).
GPT-5 Thinking Pro는 Pro 및 Team 요금제에서만 제공되며, 복잡한 작업에 더 높은 정확도를 제공.
메시지 한도 초과 시 자동으로 GPT-5 mini로 전환.
GPT-5에서 GPT-5 Thinking으로의 자동 전환은 Thinking 모델의 주간 한도에 포함되지 않음.

도구 지원

GPT-5는 ChatGPT의 모든 도구를 지원합니다:

🔍 웹 검색
📊 데이터 분석
🖼️ 이미지 분석
📁 파일 분석
🎨 캔버스
🖌️ 이미지 생성
🧠 메모리
⚙️ 사용자 지침(Custom Instructions)

모델 변경 및 이전 대화 처리

GPT-5 출시와 함께 다음 모델들이 빠지게됩니다:

GPT-4o, GPT-4.1, GPT-4.5, GPT-4.1-mini
o4-mini, o4-mini-high
o3, o3-pro

기존 대화를 열면 자동으로 GPT-5 계열 모델로 전환됩니다:

이전 모델	전환 대상
GPT-4o, 4.1, 4.5, 4.1-mini, o4-mini, o4-mini-high	GPT-5
o3	GPT-5 Thinking
o3-pro	GPT-5 Pro (Pro 및 Team 요금제에서만 사용 가능)

※ GPT-4o는 Voice 모드에서 계속 사용됩니다.

사용 정책 및 제한

Pro 및 Team 요금제는 무제한 사용이 가능하지만, 다음과 같은 사용 제한 정책이 적용됩니다:

자동화된 데이터 추출 등 남용 금지
계정 공유 및 재판매 금지
제3자 서비스에 ChatGPT를 직접 연결하는 행위 금지

정책 위반 시 일시적인 사용 제한이 발생할 수 있으며, 이 경우 지원팀을 통해 복구 요청 가능.

결론

GPT-5는 속도, 정확성, Reasoning, 안전성, 사용자 맞춤성 전 분야에서 역대 최고 수준입니다.

DEMO에서 보았듯:

코딩: 아이디어 → 앱 완성까지 한 세션
글쓰기: 감정·맥락·형식 완벽 반영
헬스케어: 정보 번역을 넘어 의사결정 동반자
멀티모달·에이전틱 툴: 실제 업무·연구·창작 전방위 활용

읽어주셔서 감사합니다 😎

서쿠

Always be passionate ✨

이전 포스트

[Anthropic] 프로덕션에서의 Vibe Coding

다음 포스트