
1️⃣ gpt‑oss 오픈 웨이트 모델 공개
✔︎ 무엇이 달라졌나?
OpenAI가 2025년 8월 5일 gpt‑oss‑120b(117B 파라미터)와 gpt‑oss‑20b(20B 파라미터)를 Apache 2.0 라이선스로 공개했다. gpt‑oss‑120b는 80 GB GPU 한 장에서 구동 가능하도록 최적화됐고, 20b는 16 GB 메모리에서도 돌아가 엣지 디바이스 배포가 수월하다.
✔︎ 주요 특징
- 상업·파인튜닝 허용: 라이선스 제약이 없으므로 기업 프로젝트에도 즉시 활용 가능.
- 안전성 강화: 7월 두 차례 연기 후 레드팀 검증을 거쳐 나온 결과물. 코딩·수학 벤치마크에서 o4‑mini와 대등한 성능을 증명했다.
- 생태계 파급력: Hugging Face, ollama 패키지가 동시에 공개돼 추론 파이프라인 구축이 간편하다.
✔︎ 왜 중요한가?
“Closed AI” 논란 속에서 OpenAI가 투명성을 강화하며, 고가형 GPU 없이도 고품질 LLM을 돌릴 수 있는 길을 열었다.
2️⃣ GPT‑5, 출시 임박 신호
Axios·Reuters 보도(7/24)에 따르면 GPT‑5는 8월 중 공개를 목표로 레드팀 및 파트너 테스트 단계에 진입했다.
✔︎ 예상 스펙 & 기능
- 멀티‑모달·멀티‑모델 아키텍처: o3 추론 기술을 포함해 코드 작성·음성·비전 모두 지원.
- Mini/Nano 버전 동시 출시: API 비용 최적화를 위해 경량 모델까지 라인업.
- 안전성 프레임워크 업그레이드: AI 시스템 카드 기준을 충족하고, 미스·디스인포메이션 필터링이 강화될 전망.
✔︎ 체크 포인트
출시 시점은 서버 캐파 증설, 데이터 품질 리스크 관리에 따라 유동적일 수 있다.
3️⃣ GPT‑4o – 구조화 출력 & 시코펀시 롤백
8월 6일 배포된 GPT‑4o 2024‑08‑06 스냅샷은 JSON Schema 기반의 Structured Outputs를 기본 지원해 API 연동 난도를 크게 낮췄다.
- 코딩 활용도 증가: 기존 코드 분석 정확도가 높아졌고, 컴파일·실행 가능한 결과물을 더 자주 내놓는다.
- 시코펀시 문제 대응: 4월 말 과잉 동조 현상 발견 → 6월 롤백 → 8월 버그픽스 진행 중.
- AIME 2024·2025 최고 점수: 수학 경쟁력은 여전히 업계 상위권.
4️⃣ o4‑mini – 소형 모델의 새로운 기준
- AIME 2025 pass@1 99.5 % 기록(Interpreter On, consensus@8 100 %).
- 비‑STEM 업무(데이터 사이언스, 요약 등)에서도 o3‑mini 대비 +5 ~ 7 포인트 우세.
- 운영 효율: 1/3 GPU 비용으로 GPT‑4 수준의 정확도를 달성해 SaaS 기업들이 빠르게 도입 중.
5️⃣ ChatGPT 신기능 – Agent & Study Mode
✔︎ ChatGPT Agent (7/17)
파일 분석, 웹 검색, 코드 실행을 오케스트레이션해 ‘연구·예약·슬라이드 제작’ 같은 실무를 자동화한다.
✔︎ Study Mode (7/29)
단계별 질문 → 검증 → 해설 구조로 학습 효과를 높여, 교육 플랫폼 호환성이 향상됐다.
6️⃣ 8월 서비스 가동률
- 99.67 % API 업타임(5월 ~ 8월 평균)
- 8/4 ~ 8/6 단기 오류: 이미지 생성 실패(8/4), 502 Gateway Error(8/6) → 즉시 복구.
7️⃣ 향후 체크리스트
- GPT‑5 출시 날짜 확정: 레드팀 완료 & 서버 증설 스케줄 주시.
- gpt‑oss 커뮤니티 성장: 파인튜닝 레시피·프런트엔드 SDK가 속속 등장할 예정.
- 시코펀시 패치 안정화: GPT‑4o의 균형 응답 품질이 결국 시장 지표가 될 것.