컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

오픈AI, 코딩 에이전트 '코덱스' 세부 정보 공개..."AI 도구 넘어 동료로 발전할 것"

AI타임스 박찬
원문보기

오픈AI, 코딩 에이전트 '코덱스' 세부 정보 공개..."AI 도구 넘어 동료로 발전할 것"

서울구름많음 / 21.3 °
[박찬 기자]

오픈AI가 인공지능(AI) 코딩 에이전트 '코덱스(Codex)'의 세부 사항을 공개했다. 이번 버전은 지시한 코딩 작업을 병렬로 처리하는 수준이지만, 앞으로는 AI 동료로 업그레이드할 것이라고 강조했다.

16일(현지시간) 인공지능(AI) 코딩 에이전트 '코덱스(Codex)'의 세부 내용을 공개했다.

코덱스는 코드 작성부터 버그 수정, 리팩토링, 테스트 작성, 코드 관련 질문 응답 등 다양한 개발 작업을 동시에 처리할 수 있는 차세대 코딩 에이전트다. 작업은 사용자의 코드 저장소가 미리 담긴 독립적인 클라우드 샌드박스 환경에서 개별적으로 실행된다.

'o3'를 소프트웨어 엔지니어링 용도로 최적화한 '코덱스-1(codex-1)'을 기반으로 작동한다.

오픈AI는 코덱스-1 훈련 목표가 "결과물을 사람의 코딩 선호도 및 표준에 맞춰 조정하는 것"이라고 밝혔다. o3와 비교했을 때, 사람이 즉시 표준 워크플로우에 통합할 수 있을 정도로 더 깔끔한 패치를 생성한다고 설명했다.

이 모델은 풀 리퀘스트(Pull Request)를 반영하도록 훈련됐으며, 테스트를 통과할 때까지 코드를 반복 실행하며 지시를 정확히 수행하는 능력을 갖추고 있다. 풀 리퀘스트는 새로운 코드 변경 사항을 원본 소스 코드에 병합하기 위한 제안을 의미한다.


사용자는 챗GPT 사이드바를 통해 코덱스에 접근할 수 있으며, '코드(Code)' 버튼을 눌러 작업을 요청하거나 '애스크(Ask)' 기능으로 코드베이스에 대한 질문을 할 수 있다. 코드 저장소 내 파일을 읽고 수정할 수 있으며, 테스트 하네스, 린터, 타입 체커 등도 실행 가능하다. 작업 소요 시간은 1~30분 내외이며, 사용자는 실시간으로 진행 상황을 모니터링할 수 있다.

코덱스는 작업 완료 후 코드 변경 사항을 샌드박스 환경 내에서 실행하며, 터미널 로그와 테스트 출력물 등의 인용 자료를 통해 작업 과정을 투명하게 제공한다. 결과를 검토한 뒤에는 깃허브 풀 리퀘스트를 생성하거나 로컬 환경에 직접 통합할 수 있다.

코덱스는 사용자의 코드 저장소 내 AGENTS.md 파일을 통해 더 효율적으로 작동할 수 있다. 이는 코덱스에 프로젝트 구조, 테스트 명령어, 코드 표준 등을 안내하는 README.md와 유사한 텍스트 파일이다. 인간 개발자와 마찬가지로 설정된 개발 환경과 명확한 문서가 있을 때 성능이 향상된다.


소프트웨어 엔지니어링 평가 지표인 'SWE-벤치'에서 최고 성능(SOTA)을 기록하며, 실무 수준의 복잡한 개발 작업 수행 능력을 입증했다.


보안과 안전성도 핵심 설계 요소다. 코덱스는 악성 코드 작성 요청을 명확히 거부하도록 훈련됐으며, 안전 평가 및 정책 강화를 통해 정당한 사용 사례는 지원하면서도 악용 가능성을 차단한다.

인터넷이 차단된 격리된 클라우드 환경에서 작동하며, 외부 웹사이트나 API 접근이 불가능하다. 이를 통해 사용자 코드베이스에 대한 철저한 제어와 검증 가능성을 보장한다.


실제로 코덱스의 터미널용 버전인 '코덱스 CLI(Codex CLI)'도 공개했다. 이 오픈 소스 도구는 'o3' 및 'o4-미니' 기반 모델을 로컬 환경에서 활용할 수 있게 하며, 반복 작업 자동화, 코드 Q&A, 빠른 수정 작업 등에 특화돼 있다.

함께 출시된 경량 모델 '코덱스-미니-최종(codex-mini-latest)'은 코덱스 CLI의 기본 모델로 설정되며, 응답 속도와 명령 이행 능력이 강화됐다. API에서도 이용 가능하며, 입력 100만 토큰당 1.50달러, 출력 100만 토큰당 6달러의 가격에 제공된다. 프롬프트 캐싱에 따른 최대 75% 요금 할인도 적용된다.

코덱스 CLI는 챗GPT 계정으로 로그인하면 자동으로 API 키가 설정되며, 프로와 플러스 사용자에게는 각각 50달러, 5달러의 무료 API 크레딧도 제공된다.

오픈AI는 "코덱스는 이제 시작에 불과하다"라며 "단순한 자동화 도구가 아니라, 개발팀과 협업하는 AI 동료로 발전시키는 것이 목표"라고 밝혔다.

이번 버전에서는 여러 소프트웨어 엔지니어링 작업을 동시에 병렬 처리할 수 있으며, 실행 중에는 사용자가 다른 작업을 실행할 수 있도록 설계하는 데 중점을 뒀다. "비동기식 다중 에이전트 워크플로우가 엔지니어들이 고품질 코드를 생성하는 실질적인 방법이 될 것"이라는 섥명이다.

그리고 "궁극적으로 실시간 페어링과 작업 위임이라는 두가지 상호작용 모드가 융합되는 것을 볼 수 있을 것"이라고 예고했다. 개발자가 작업 도중에 지침을 제공하고 전략에 대해 협업하며 진행 상황에 대한 사전 업데이트를 받을 수 있게 될 것이라는 설명이다.

https://twitter.com/12exyz/status/1923401247794561535

한편, 렉스 아사보르 오픈AI 개발자는 X(트위터)를 통해 "코덱스는 새벽 3시15분, 회사 코드베이스에서 무단으로 수정 초안을 작성할 수 있을 만큼 뛰어난 AI"라는 글을 올렸다.

이는 그록의 코드 무단 수정이 3시15분에 벌어졌다는 발표를 빗댄 것이다. 즉, 코덱스는 그록의 코드 무단 수정에도 유용할 것이라며, 일론 머스크 CEO와 xAI를 저격한 것이다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>