ChatGPT

제목 : 이전 기사 AI타임스 "오픈AI, '시리' 등 음성비서 강화할 새 멀티모달 모델 개발" SNS 기사보내기 SNS 기사보내기페이스북(으)로 기사보내기 트위터(으)로 기사보내기 카카오톡(으)로 기사보내기 네이버블로그(으)로 기사보내

작성일 : 2024-05-12 19:20
조회수 : 76
작성자 : KWSEO
https://www.aitimes.com/news/articleView.html?idxno=159578

aitimes 24.05.12

오픈AI, 멀티모달 기능 강화한 새로운 모델 개발

오픈AI가 기존 'GPT-4 터보'보다 멀티모달 기능이 강화된 새로운 모델을 개발 중이라는 증언이 나왔다. 이 모델은 애플의 음성 비서 '시리'를 강화하고, 향후 출시될 '챗GPT 전용 장치'에 탑재될 예정이다.

디 인포메이션은 10일(현지시간) 오픈AI가 일부 고객에게 새로운 LMM(Large Multimodal Model)을 시연했다고 보도했다. 이 모델은 이미지와 오디오를 보다 효과적으로 이해하고 실행 속도도 개선된 것으로 알려졌다. 해당 모델은 13일 열리는 봄철 업데이트 발표에 포함될 가능성이 있다.

현재 오픈AI의 챗GPT는 음성 대화 및 이미지 인식 기능을 지원하고 있으나, 이번 모델은 이러한 기능을 더욱 통합하여 성능을 향상시켰다. 특히 고객 서비스 AI 상담원은 발신자의 목소리 억양이나 감정을 더 잘 이해할 수 있으며, 학생들의 수학 문제 해결, 간판이나 메뉴판 번역 등에 유용할 것으로 기대된다.

이 모델 개발은 사업적 필요에서 비롯된 것으로 보인다. 1월에 시작된 애플과의 계약이 진전을 보지 못하다가, 4월 말부터 급진전을 보인 이유가 이 모델의 완성 덕분이라는 분석이다. 시리의 성능 향상을 위해 음성 대화와 이미지 인식 기능이 필요하며, 샘 알트먼 CEO가 조니 아이브와 함께 추진 중인 챗GPT 전용 장치 스타트업에도 이 LMM이 필수적이다.

다만, 이 모델은 아직 온디바이스 AI로 실행하기엔 크기가 크다고 알려졌다. 그러나 GPT-4 터보보다 저렴하게 실행하는 것을 목표로 하고 있다. 이로 인해 'GPT 스토어' 등 다른 일정은 지연된 것으로 보인다.

한편, 더 버지에 따르면, 오픈AI는 챗GPT에 전화 통화 기능을 추가하려는 움직임이 있다. 이룹 개발자가 공개한 챗GPT 코드 스크린샷에는 오디오 및 비디오 통신용 서버 연결이 포함된 것으로 나타났다. 이는 구글이 테스트 중인 'AI 통화' 기능과 유사하며, AI가 먼저 전화를 걸고, 연결 시 실제 상담원에게 통화를 넘겨주는 방식이다.

또한, 오픈AI는 기업 사용자가 챗GPT를 사용하는 데 필요한 예약 토큰을 선불로 지불할 경우, 최대 50% 할인하는 새로운 요금 정책을 도입할 것으로 알려졌다. 이를 통해 기업 고객을 확대하려는 전략이다.