Da li ste čuli za Animate Anyone? U pitanju je nova primena veštačke inteligencije u manipulaciji foto i video materijalom. Razvijena od strane istraživača u Institute for Intelligent Computing u okviru Alibaba Groupe, ova tehnika generisanja videa omogućava pretvaranje statičnih slika u realistične video snimke.
Za razliku od nešto starijih sistema poput BDMM (City Unversity Hong Kong) i DreamPose (University of Washington, UC Berkley, Google Research, Nvidia), koji su se pojavili ranije tokom leta, Animate Anyone predstavlja značajno unapređenje. Ovaj sistem može da izvuče detalje poput facijalnih karakteristika, obrazaca i poza iz referentne slike (npr. modne fotografije modela), a zatim stvara seriju slika na kojima su ovi detalji primenjeni na blago i postepeno izmenjene poze.
Iako su tehnički aspekti neverovatno kompleksni, važno je istaći da su istraživači uveli novi međukorak koji omogućava ovom programu da bolje prouči i nauči odnose među delovima referentne slike što doprinosi boljem očuvanju detalja. Međutim, najveći izazov je, kao i kod ostalih image modela (OpenAI Dall-E, Midjourney, Stability AI Stable Diffusion, Deepfake AI, BDMM, DreamPose…) u vernom prikazu očiju i ruku. Takođe, problem je očuvanje konzistentnosti poza kada se one znatno razlikuju od originalne fotografije. Model će sigurno dati bolje rezultate kada se poze ne razlikuju previše u odnosu na originalnu fotografiju i kada postoji manje detalja.
Ovi programi imaju veliki potencijal, pogotovo u industriji zabave i modnoj industriji. Međutim, ono što je posebno uznemirujuće, jeste da bi, korišćenjem samo jedne kvalitetne fotografije neke osobe, bilo moguće kreirati video u kom ta osoba radi maltene, bilo šta. Takve fotografije svi imamo na našim profilima društvenih mreža. Ako se takav video snimak dodatno doradi nekom tehnologijom za animaciju lica i na to doda text-to-voice snimak glasa, ovo otvara vrata za stvaranje veoma realističnih i potencijalno katastrofalno štetnih deepfake materijala…
Tim koji je razvio ovu tehnologiju za sada nije objavio kod za širu javnost, ali planira da to učini u skorijoj budućnosti. Ovo još jednom naglašava pitanja etike i odgovornosti u AI zajednici, kao i potrebu za regulacijom ove vrste tehnologije. Uvođenje nekakve vrste vodenog žiga bi bilo vrlo poželjno.
Ime Moloh je u Starom Zavetu vezano za žrtvovanje dece. Praksa koja je bila i…
Mali pogled unazad. Turnir između Google DeepMind AlphaGo i korejskog Go majstora Lee Sedol-a. Dan…
Jezički modeli (Language models) su matematički, statistički modeli koji mogu da izračunaju verovatnoću javljanja jedne…
Još jedan webinar na engleskom za klijenta Academy Class iz Londona. Tema je fotografisanje i…
Novi webinar na engleskom za klijenta Academy Class iz Londona. Webinar traje 30-ak minuta i prikazuje…
Tim Miller, reditelj novog Holivudskog blokbastera Deadpool, govori o tome kako su se odlučili da…