De ce generatoarele de imagini AI se luptă cu mâinile

De ce generatoarele de imagini AI se luptă cu mâinile
Cititorii ca tine ajută la sprijinirea MUO. Când efectuați o achiziție folosind link-uri de pe site-ul nostru, este posibil să câștigăm un comision de afiliat. Citeşte mai mult.

Generatoarele AI evoluează în fața ochilor noștri într-un ritm înfricoșător, dar au încă defecte. Observarea detaliilor ciudate în imaginile AI este de fapt destul de amuzantă. De aceea, mâinile Midjourney au devenit un subiect fierbinte, o problemă comună la multe motoare.





Să dezvăluim de ce mâinile provoacă atât de mult generatoarele de imagini AI. Programatorii lor rezolvă deja această problemă demnă de meme, dar este interesant să ne gândim la modul în care învață inteligența artificială, ca să nu mai vorbim de ce îi iese în cale.





REALIZAREA VIDEOCLIPULUI ZILEI Derulați PENTRU A CONTINUA CU CONȚINUT

De ce mâinile generate de AI au făcut furori

Oricine folosește motoare AI pentru a crea imagini poate să fi observat că mâinile rareori ies corect, dar problema a întors capul când o grămadă de „fotografii” au apărut pe Twitter.





La o inspecție mai atentă, mâinile ciudate ale oamenilor le-au dat departe ca imagini generate de AI. Faptul că aceasta a fost încercarea lui Midjourney a făcut situația mai interesantă.

Unul dintre cele mai bune motoare AI din jur nu a putut aborda complexitatea mâinilor umane, așa că capacitățile Midjourney și ale concurenților săi au fost puse la încercare. Destul de adevărat, chiar și DALL-E este predispus la degete și unghii nerealiste.



  de oameni care dau mâna pe DALL-E

Exprimarea a fost disproporționată, având în vedere că mâinile generate de AI au fost întotdeauna o problemă, dar atenția suplimentară a determinat eliberarea Midjourney v5 pentru îmbunătățirea v4 .

cum să ștergi altul pe iPhone

Noua versiune a avut drept scop îmbunătățirea designului mâinii, un indiciu clar că inginerii AI au acordat atenție agitației amuzante și au decis să actualizeze capacitățile software-ului.





Alte motoare sunt lente să urmeze exemplul lui Midjourney, deci repararea artei AI cu Photoshop rămâne o abilitate neprețuită. Principalul obstacol pentru programatori este cât de complicat este să antrenezi inteligența artificială pentru a desena mâini convingătoare.

De ce se luptă generatoarele de imagini AI cu mâinile?

Motoarele de inteligență artificială folosesc rețele generative adverse (GAN) sau Stable Diffusion pentru a produce imagini. Ambele tehnologii necesită materiale sursă extinse, instruire și putere de procesare pentru a crea chiar și cele mai elementare opere de artă.





Deoarece imaginile preexistente sunt esențiale pentru formarea unui AI, programatorii trebuie să-și alimenteze software-ul cu mii, dacă nu milioane, de imagini alături de solicitări – repetând procesul de nenumărate ori până când motorul înțelege la ce se referă un anumit cuvânt și cum să reprezinte. acel obiect.

cum să găsiți numele computerului Windows 10

Dar imaginile sursă din care învață AI sunt în principal 2D, în care mâinile sunt reprezentate într-o varietate de poziții. Fie drept sau ondulat, arătând cinci sau trei degete.

La sfârșitul zilei, o mașină nu înțelege de fapt conceptul de mâini, iar imaginile din care învață nu prezintă întotdeauna mâinile suficient de clar sau consecvent. De aceea, mâinile Midjourney pot fi atât de urâte: confuzie AI.

La fel de valabil ca Preocupările lui Elon Musk cu privire la dezvoltarea AI poate, unele părți ale tehnologiei mai au multe de învățat. Și obstacolele lor depășesc exemplele insuficiente de mâini.

Alte motive pentru care generatoarele de imagini AI se îmbunătățesc încet

  Femeie care codifică pe computer

Uitandu-ma la Modelele lui Midjourney , v5 oferă o coerență avansată între solicitările de text și imaginile produse, precum și o rezoluție mai mare și instrumente suplimentare. Dar astfel de realizări nu sunt ieftine.

pot șterge hiberfil.sys Windows 10

Antrenarea unui AI pentru a face mai bine cu mâinile necesită să-i hrănești imagini mai bune, mai ales în 3D. Aceasta înseamnă că se cheltuiește mult timp și forță de muncă pentru procese, de la achiziționarea de materiale sursă până la îmbunătățirea codării și repetarea instruirii până când AI-ul reușește.

Chiar și atunci, software-ul poate face greșeli în opere de artă altfel uimitoare. Pe lângă faptul că este o muncă uriașă și complexă, este costisitoare. Deci, nu vă așteptați generatoare gratuite de text în imagine AI să urce încă la calibrul lui Midjourney.

Mai simplu spus, problema cu motoarele AI nu este doar despre incapacitatea acestor programe de calculator de a înțelege complet cum arată sau funcționează caracteristicile umane precum mâinile și picioarele. De asemenea, se reduce la costurile și accesul tehnologiei la imagini 3D și tehnici de învățare automată care pot ajuta generatorii să înțeleagă mai realistă lumea din jurul lor.

Generatoarele de imagini AI nu se vor lupta pentru totdeauna

Mâinile sunt un concept dificil pentru inteligența artificială pentru a-și înfășura capul binar, dar soluțiile la problemă sunt deja la lucru. Midjourney, DALL-E 2 și alte platforme vor putea în cele din urmă să mențină degetele ciudate la minimum, dacă nu să le elimine complet.

Progresele din alte domenii ale AI asigură că tehnologia evoluează constant, iar dezvoltatorii săi învață mereu noi moduri de a o aplica și de a o îmbunătăți.