Veštačka inteligencija (Artificial Intelligence - AI) “Animate Anyone” je odlično rešenje za zabavu i modnu industriju ali i za deepfake zloupotrebe

“Animate Anyone” je odlično rešenje za zabavu i modnu industriju ali i za deepfake zloupotrebe

05.12.2023 05.12.2023Veštačka inteligencija (Artificial Intelligence - AI), Video alati

Da li ste čuli za Animate Anyone? U pitanju je nova primena veštačke inteligencije u manipulaciji foto i video materijalom. Razvijena od strane istraživača u Institute for Intelligent Computing u okviru Alibaba Groupe, ova tehnika generisanja videa omogućava pretvaranje statičnih slika u realistične video snimke.

Animate Anyone u odnosu na prethodne tehnike

Za razliku od nešto starijih sistema poput BDMM (City Unversity Hong Kong) i DreamPose (University of Washington, UC Berkley, Google Research, Nvidia), koji su se pojavili ranije tokom leta, Animate Anyone predstavlja značajno unapređenje. Ovaj sistem može da izvuče detalje poput facijalnih karakteristika, obrazaca i poza iz referentne slike (npr. modne fotografije modela), a zatim stvara seriju slika na kojima su ovi detalji primenjeni na blago i postepeno izmenjene poze.

Tehnički aspekti i izazovi generative AI animacija

Iako su tehnički aspekti neverovatno kompleksni, važno je istaći da su istraživači uveli novi međukorak koji omogućava ovom programu da bolje prouči i nauči odnose među delovima referentne slike što doprinosi boljem očuvanju detalja. Međutim, najveći izazov je, kao i kod ostalih image modela (OpenAI Dall-E, Midjourney, Stability AI Stable Diffusion, Deepfake AI, BDMM, DreamPose…) u vernom prikazu očiju i ruku. Takođe, problem je očuvanje konzistentnosti poza kada se one znatno razlikuju od originalne fotografije. Model će sigurno dati bolje rezultate kada se poze ne razlikuju previše u odnosu na originalnu fotografiju i kada postoji manje detalja.

Artificial intelligence, veštačka inteligencija, slika u video, image to video, diffusion model, Alibaba, deepfake video

Potencijalne zloupotrebe Animate Anyone

Ovi programi imaju veliki potencijal, pogotovo u industriji zabave i modnoj industriji. Međutim, ono što je posebno uznemirujuće, jeste da bi, korišćenjem samo jedne kvalitetne fotografije neke osobe, bilo moguće kreirati video u kom ta osoba radi maltene, bilo šta. Takve fotografije svi imamo na našim profilima društvenih mreža. Ako se takav video snimak dodatno doradi nekom tehnologijom za animaciju lica i na to doda text-to-voice snimak glasa, ovo otvara vrata za stvaranje veoma realističnih i potencijalno katastrofalno štetnih deepfake materijala…

Budućnost upotrebe veštačke inteligencije i etika

Tim koji je razvio ovu tehnologiju za sada nije objavio kod za širu javnost, ali planira da to učini u skorijoj budućnosti. Ovo još jednom naglašava pitanja etike i odgovornosti u AI zajednici, kao i potrebu za regulacijom ove vrste tehnologije. Uvođenje nekakve vrste vodenog žiga bi bilo vrlo poželjno.

About Branko Jovanović

Pasionirani ljubitelj multimedije i veštačke inteligencije. Grafički i web dizajner, frontend i AS3 programer. Najviše, ipak, volim da obrazovnu delatnost i držanje obuka iz ovih oblasti. Do sada sam obučio više od 3000 polaznika i održao preko 25000 školskih časova. Ipak, pošto firma Adobe polako ukida program sertifikovanih instruktora i trening centara, tome je morao doći kraj. Za više informacija pogledajte stranicu O nama

View all posts by Branko Jovanović →

Оставите одговор Одустани од одговора

This site uses Akismet to reduce spam. Learn how your comment data is processed.