멀티모달 Ai가 온다.
조만간 소개될 GPT-4는 현재 다들 많이들 경험한 챗GPT의 차기 버전이다. 그런데 이게 "멀티모달(multimodal)"이 될 가능성이 있다는 소문을 들었다. 아니나다를까, 트위터 등에서 관계자들이 암시하는 이야기들을 들어보면, 적어도 부분적으로, 그리고 초보적으로나마 이번에 뭐가 되기는 될 모양이다. 멀티모달, 그게 무슨 뜻이며, 뭐가 어떻게 얼마나 달라진다는 것일까. 생각난 김에 몇 자 적어본다. 텍스트뿐 아니라 음성, 이미지, 비디오 등 다양한 형태의 데이터를 복합적으로 이해하고 생성까지도 하는 Ai를 말한다. 사용자가 입력한 텍스트에 관련된 이미지나 비디오를 만들어주거나, 반대로 이미지나 비디오를 보고(?) 텍스트로 설명을 써줄 수도 있고 뭐 그렇다. 여기까지는 다들 안다. 그럼 이제부터 뭐가..