마이크로소프트는 VISA-1이라는
사진 한장과 음성샘플만 있으면
말하는 영상을 만드는 AI를 발표했는데
현재는 연구팀만 사용 가능하다고 하지만
노래 부르는 것도 가능하고
모나리자같은 그림에도 적용됨
이 모델은 512x512 픽셀이미지를 초당 45프레임으로 만드는 작업에
데스크탑의 엔비디아 RTX 4090 GPU로
2분이 소요되고
온라인(실시간)은 40fps가 생성 가능하다고 함
[30]
루리웹-28749131 | 09:43 | 조회 0 |루리웹
[11]
찌찌야 | 09:43 | 조회 0 |루리웹
[31]
나만정상인 | 09:38 | 조회 0 |루리웹
[4]
스텔LIVE | 09:28 | 조회 0 |루리웹
[14]
유진★아빠 | 09:35 | 조회 349 |SLR클럽
[15]
쌍파리 | 09:07 | 조회 1962 |오늘의유머
[21]
wizwiz | 09:34 | 조회 0 |루리웹
[7]
인형 메리 | 09:33 | 조회 0 |루리웹
[19]
그리니드1 | 09:32 | 조회 0 |루리웹
[27]
올때빵빠레 | 09:32 | 조회 0 |루리웹
[28]
루리웹-28749131 | 09:29 | 조회 0 |루리웹
[6]
오리착지 | 09:29 | 조회 0 |루리웹
[26]
루리웹-9238656793 | 09:27 | 조회 0 |루리웹
[11]
유진★아빠 | 09:29 | 조회 336 |SLR클럽
[13]
마티맥플라이 | 09:21 | 조회 973 |SLR클럽
댓글(2)
다메다메~ 다메요~ 다메 나노요~
겜 같은거 일러 한장으로 다 해먹을 수 있단거네