Da li ste čuli za Animate Anyone? U pitanju je nova primena veštačke inteligencije u manipulaciji foto i video materijalom. Razvijena od strane istraživača u Institute for Intelligent Computing u okviru Alibaba Groupe, ova tehnika generisanja videa omogućava pretvaranje statičnih slika u realistične video snimke.
Animate Anyone u odnosu na prethodne tehnike
Za razliku od nešto starijih sistema poput BDMM (City Unversity Hong Kong) i DreamPose (University of Washington, UC Berkley, Google Research, Nvidia), koji su se pojavili ranije tokom leta, Animate Anyone predstavlja značajno unapređenje. Ovaj sistem može da izvuče detalje poput facijalnih karakteristika, obrazaca i poza iz referentne slike (npr. modne fotografije modela), a zatim stvara seriju slika na kojima su ovi detalji primenjeni na blago i postepeno izmenjene poze.
Tehnički aspekti i izazovi generative AI animacija
Iako su tehnički aspekti neverovatno kompleksni, važno je istaći da su istraživači uveli novi međukorak koji omogućava ovom programu da bolje prouči i nauči odnose među delovima referentne slike što doprinosi boljem očuvanju detalja. Međutim, najveći izazov je, kao i kod ostalih image modela (OpenAI Dall-E, Midjourney, Stability AI Stable Diffusion, Deepfake AI, BDMM, DreamPose…) u vernom prikazu očiju i ruku. Takođe, problem je očuvanje konzistentnosti poza kada se one znatno razlikuju od originalne fotografije. Model će sigurno dati bolje rezultate kada se poze ne razlikuju previše u odnosu na originalnu fotografiju i kada postoji manje detalja.
Potencijalne zloupotrebe Animate Anyone
Ovi programi imaju veliki potencijal, pogotovo u industriji zabave i modnoj industriji. Međutim, ono što je posebno uznemirujuće, jeste da bi, korišćenjem samo jedne kvalitetne fotografije neke osobe, bilo moguće kreirati video u kom ta osoba radi maltene, bilo šta. Takve fotografije svi imamo na našim profilima društvenih mreža. Ako se takav video snimak dodatno doradi nekom tehnologijom za animaciju lica i na to doda text-to-voice snimak glasa, ovo otvara vrata za stvaranje veoma realističnih i potencijalno katastrofalno štetnih deepfake materijala…
Budućnost upotrebe veštačke inteligencije i etika
Tim koji je razvio ovu tehnologiju za sada nije objavio kod za širu javnost, ali planira da to učini u skorijoj budućnosti. Ovo još jednom naglašava pitanja etike i odgovornosti u AI zajednici, kao i potrebu za regulacijom ove vrste tehnologije. Uvođenje nekakve vrste vodenog žiga bi bilo vrlo poželjno.