반응형 gpt-4o2 AI 동영상 편집 서비스 비디오스튜, GPT-4o 적용한 업데이트 출시 AI로 보다 쉽고 편하게 동영상을 편집할 수 있는 비디오스튜(VideoStew) 서비스에 OpenAI의 최신 GPT-4o가 적용되었다는 소식입니다. 비디오스튜는 라지온에서 소개시켜드린 후에도 꾸준하게 업그레이드를 진행해 왔습니다. 위 그림에서 보시다시피 훨씬 풍부해진 템플릿(지금은 레시피라고도 부르네요)도 있습니다만. 이번에 비디오스튜에서는 AI 스톡 라이브러리 매칭 기능을 개선했습니다. 비디오스튜 내부적으로 공을 많이 들인 업데이트라고 하는데, 위자드 모드를 통해 콘텐츠를 생성할 때 영상이나 이미지를 매칭하는 AI 알고리즘을 개선했습니다.그 내용을 요약하면 최근 화제가 되었던 OpenAI의 GPT-4o를 기반으로 텍스트에 어울리는 스톡 라이브러리를 AI가 눈으로 찾고 반영하는 구조로 바뀌었다고 하네요.. #소프트웨어#앱#서비스 2024. 6. 17. OpenAI, 소리와 화상, 문자 주고받으며 더 사람같아진 GPT-4o 발표 OpenAI에서 보고 듣고 말하는 더 진보된 AI 모델인 GPT-4o를 발표했습니다. GPT-4o의 o는 옴니(omni)를 뜻하는데, 사람과 컴퓨터의 더 자연스러운 상호작용을 위해 만들어졌습니다. 문자와 소리, 이미지의 조합을 입력으로 받아들일 수 있으며 반대로 이들을 출력할 수 있습니다. 사람과 비슷한 수준인 최소 232밀리초, 평균 320밀리초 만에 오디오 입력에 응답할 수 있습니다..GPT-4o는 특히 기존 모델에 비해 시각 및 오디오 이해 능력이 뛰어납니다. 소리-문장 변환과 그 문장의 입출력이 세개의 파이프라인으로 나뉘었던 이전의 음성 모드와는 달리 GPT-4o는 모든 입력과 출력을 동일한 신경망으로 처리할 수 있게 되었습니다. 이 때문에 GPT-4o는 그 전에는 안 되었던 말하는 이의 음성 .. #소프트웨어#앱#서비스 2024. 5. 14. 이전 1 다음 반응형