마이크로소프트는 VISA-1이라는
사진 한장과 음성샘플만 있으면
말하는 영상을 만드는 AI를 발표했는데
현재는 연구팀만 사용 가능하다고 하지만
노래 부르는 것도 가능하고
모나리자같은 그림에도 적용됨
이 모델은 512x512 픽셀이미지를 초당 45프레임으로 만드는 작업에
데스크탑의 엔비디아 RTX 4090 GPU로
2분이 소요되고
온라인(실시간)은 40fps가 생성 가능하다고 함
[8]
Azure◆Ray | 08:40 | 조회 407 |SLR클럽
[4]
InGodWeTrust | 08:40 | 조회 556 |SLR클럽
[5]
감나무건너상회 | 08:36 | 조회 0 |루리웹
[14]
네리소나 | 08:33 | 조회 0 |루리웹
[15]
큐베의기묘한모험 | 08:31 | 조회 0 |루리웹
[15]
Sgt오드볼 | 08:30 | 조회 0 |루리웹
[11]
공허의 금새록 | 08:29 | 조회 0 |루리웹
[9]
Nuka-World | 08:26 | 조회 0 |루리웹
[9]
남파근첩 | 08:20 | 조회 0 |루리웹
[18]
Azure◆Ray | 08:29 | 조회 416 |SLR클럽
[4]
무뇨뉴 | 08:03 | 조회 0 |루리웹
[3]
아라리가났네 | 08:17 | 조회 690 |SLR클럽
[20]
Azure◆Ray | 08:20 | 조회 1093 |SLR클럽
[4]
무뇨뉴 | 08:27 | 조회 0 |루리웹
[12]
잭 그릴리쉬 | 08:25 | 조회 0 |루리웹
댓글(2)
다메다메~ 다메요~ 다메 나노요~
겜 같은거 일러 한장으로 다 해먹을 수 있단거네