오픈AI가 텍스트 속도와 시청각 처리 가능을 강화한 GPT-4o를 공개했다 [사진: 오픈AI] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 오픈AI가 지난 5월 출시한 AI 모델 'GPT-4o'에 이미지로 파인튜닝(미세조정)하는 기능을 추가했다고 2일 온라인 매체 기가진이 전했다.
이전에는 텍스트로만 파인튜닝이 가능했지만, 이미지에서의 파인튜닝이 가능하게 돼 시각적 검색이나 객체 검출 등의 기능을 향상시킬 수 있게 됐다.
오픈AI는 "GPT-4o에서 처음으로 미세 조정을 도입한 이래 수십만 명의 개발자가 텍스트 전용 데이터 세트로 모델을 사용자 정의하고 특정 작업의 성능을 향상시켜 왔다"고 전했다. 그러나 텍스트만으로 모델을 미세 조정하는 것만으로는 기대하는 만큼의 성능 향상을 얻지 못하는 경우가 많아, 이미지를 활용한 미세 조정 기능이 필요하다고 강조했다.
GPT-4o의 파인튜닝을 하려면 먼저 파인튜닝의 대시보드에 액세스하고 화면상의 '+Create' 버튼을 클릭한다. 기본 모델 목록에서 'gpt-4o-2024-08-06'을 선택한 후, 이미지 데이터 세트의 파일을 선택하고 업로드용 양식으로 드래그 앤 드롭하면 끝이다. 오픈AI는 100장의 이미지만으로 GPT-4o 이미지 인식 작업의 성능을 향상시킬 수 있다고 전했다.
이미지를 이용한 GPT-4o의 파인튜닝 기능은 최신 모델의 'gpt-4o-2024-08-06'에서 지원되고 있으며, 유료 계정 티어를 가진 모든 개발자가 사용할 수 있다. 10월까지는 하루에 100만 트레이닝 토큰이 무료로 제공되며, 11월 1일 이후의 파인 튜닝에는 100만 토큰당 25달러(약 3만3000원), 입력에 100만 토큰당 3.75달러(약 4900원), 출력에 100만 토큰당 15달러(약 2만원)의 비용이 든다.
️ We're adding support for vision fine-tuning. You can now fine-tune GPT-4o with images, in addition to text. Free training till October 31, up to 1M tokens a day. https://t.co/Nqi7DYYiNC pic.twitter.com/g8N68EIOTi
— OpenAI Developers (@OpenAIDevs) October 1, 2024<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.