안녕하세요 아이티 박사 호입니다.



오늘은 6년만에 open AI 가 내놓은 오픈소스 gpt oss에 대해서 알아보겟습니다.

낮은 비용으로 강력한 실제 성능을 제공하는 두 개의 최신 오픈 웨이트 언어 모델 gpt-oss-120b와 gpt-oss-20b를 출시했다고 합니다.

 Apache 2.0 라이선스에 따라 사용할 수 있다고 합니다.

그리고 엄청 추론을 잘한다 좋다~! 라고 이야기하는데 ... 일단 사용을 해봐야겠지요? 요즘 구글 제미나이가 잘나가다 보니 2025년8월5일 기준입니다.. 예전 같으면 와~ 대박 하겠지만 .. 요즘은 딥시크 오픈소스 그외에도 엄청 나오고 있기 때문에 돌다리도 두들기는 심정으로 해봐야합니다.

세부 내용은 아래와 같습니다.

모델

계층

총 파라미터

토큰당 활성 파라미터

총 전문가

토큰당 총 전문가

컨텍스트 길이

gpt-oss-120b

36

1,170억

51억

128

4

128k

gpt-oss-20b

24

210억

36억

32

4

128k


오픈AI가 2025년 8월 5일(현지 시간), GPT-2 이후 6년 만에 새로운 오픈소스 모델 gpt-oss 시리즈를 공개하며 업계의 주목을 받고 있습니다. GPT-3부터 GPT-4o, o3 등 최근의 주력 모델들이 모두 폐쇄형(Closed Source)이었던 점을 고려하면, 이번 오픈소스 전환은 매우 이례적인 행보죠~

공개된 모델은 gpt-oss-20b와 gpt-oss-120b 두 가지로, 각각 210억 개와 1170억 개의 매개변수를 탑재하고 있으며, 성능 또한 기존의 o3, o4-mini 모델과 유사한 수준으로 알려졌습니다. 특히 gpt-oss-120b는 코드 벤치마크에서 오픈AI의 상업용 모델인 o3에 필적하는 성적을 보여, 상업 모델을 대체할 가능성도 점쳐집니다~

모델은 Apache License 2.0으로 공개되며, 상업적 이용과 2차 창작까지 가능하다. 사용자들은 인터넷 연결 없이도 온디바이스 환경에서 모델을 구동할 수 있고, 허깅페이스(Hugging Face), MS Azure, AWS 등 다양한 플랫폼을 통해 자유롭게 접근할 수 있습니다. 특히 20B 모델은 일반 노트북이나 데스크탑에서도 실행 가능할 만큼 경량화되었고요~

흥미로운 점은 오픈AI가 이번 모델에 ‘사고 사슬(Chain of Thought)’ 훈련을 의도적으로 적용하지 않았다는 것이다. 이는 모델이 내린 결론의 추론 과정을 드러내는 기능으로, 오작동 탐지를 위해서는 내부적으로만 사용되고 외부 공개는 제한된다. 오픈AI는 이 기능이 노출될 경우, 법적·윤리적 문제 발생 가능성을 우려하고 있습니다.

AI 생태계 전반에 큰 파급력을 가진 이 결정은, 메타, 앤스로픽, 구글 등 오픈소스 모델에 투자하던 다른 기술 기업들의 전략에도 영향을 줄 것으로 보입니다.. 이미 Hugging Face에서는 gpt-oss 모델 기반의 다양한 무료 서비스가 빠르게 등장하고 있으며, 이는 유료 AI 서비스의 점유율 하락을 초래할 수 있다는 분석도 나옵니다.

오픈AI 측은 이번 공개가 오픈소스 생태계에 대한 투자 가치 판단을 위한 실험적인 성격이 크다고 설명합니다. 향후 gpt-oss의 실제 활용성과 사용자 피드백에 따라 오픈AI의 개방형 모델 전략이 지속될지 여부가 결정될 예정입니다.

GPT-5 공개를 앞둔 시점에서 진행된 이번 오픈소스 모델 출시는 단순한 ‘공익적 선택’이라기보다는, AI 시장에서의 영향력 확대를 위한 고도의 전략이라는 평가도 함께 나옵니다.

그럼에도 불구하고 open AI 오픈 소스 대단합니다~!응원하겠습니다.