반응형
구글이 새로운 비디오 생성 AI를 발표했습니다.
'뤼미에르(Lumiere)'라는 이름의 모델인데 데모영상을 봤을 때는
이전에 발표했던 이마젠(Imagen Video)이나 페나키(Phenaki)보다 더 발전된 모습을 보여주고 있는 것 같습니다.
깃헙에 올라온 소개글을 보면 다양한 기능을 확인할 수 있는데, 기본적으로 텍스트를 영상으로 만들어주는 기능이 있고, 사진을 영상으로 바꿔주는 기능도 탑재돼 있습니다.
눈에 띄는 다른 기능들도 많습니다.
• 레퍼런스 이미지의 스타일대로 새로운 영상을 만들어 주는 Stylized Generation
• 원본 비디오를 다양한 스타일로 수정해주는 Video Stylization
• 이미지의 특정 부분만 움직이는 영상으로 변환해주는 Cinemagraphs
• 영상에서 가려진 부분을 알아서 채워주는 Video Inpainting
홈페이지에 예시와 함께 영상이 많이 올라와 있는데
아래 링크 타고 한번 직접 확인해 보세요!!
Lumiere - Google Research
Space-Time Text-to-Video diffusion model by Google Research.
lumiere-video.github.io
데모영상이나 홈페이지에 올라온 예시를 보면, 인물사진을 활용해서 영상을 만드는 장면은 안나오네요. 사물이나 풍경은 현재 기술로 자연스럽게 만들 수 있지만, 인물은 아직까지 그 정도로 발전하진 못했나 봅니다.
그러니 보니 메타나 스테이블 디퓨전도 비디오 생성 AI를 발표할 때 인물을 부각하진 않았던 것 같네요🤔
최근 추세를 보니 AI 기업들이 이젠 영상에 많은 투자를 하고 있는 것 같습니다.
업데이트되는 주기도 점점 짧아지는 것 같고요.
오픈AI도 비디오 생성형 AI 시장에 뛰어들만한데 조용하네요.
새로운 시장에 도전하는 구글의 미래를 한번 기대해 보시죠!!
반응형