Cele mai bune 5 generatoare de imagini AI open-source

Cele mai bune 5 generatoare de imagini AI open-source

Legături rapide

Modelele de generare text-to-image bazate pe inteligență artificială sunt peste tot și devin mai ușor de accesat zilnic. Deși este ușor să vizitați un site web și să generați imaginea pe care o căutați, generatoarele open-source text-to-image sunt cel mai bun pariu dacă doriți mai mult control asupra procesului de generare.





REALIZAREA VIDEOCLIPULUI ZILEI DEfilați PENTRU A CONTINUA CU CONȚINUT

Există zeci de generatoare de text în imagine AI gratuite și open-source disponibile pe internet, care sunt specializate în anumite tipuri de imagini. Așadar, am cercetat grămada și am găsit cele mai bune generatoare open-source AI de text-to-image pe care le puteți încerca chiar acum.





1 Pastel

  craiyon-home-page

Craiyon este unul dintre cele mai ușor accesibile generatoare de imagini AI open-source. Se bazează pe DALL-E Mini și, în timp ce puteți clona Depozitul Github și instalați modelul local pe computer, Craiyon pare să fi renunțat la această abordare în favoarea site-ului său.





Depozitul oficial Github nu a fost actualizat din iunie 2022, dar cel mai recent model este încă disponibil gratuit pe site-ul oficial Craiyon . Nu există nici aplicații pentru Android sau iOS.

În ceea ce privește funcționalitatea, veți vedea toate opțiunile obișnuite pe care le așteptați de la un generator de imagini AI. Odată ce ați introdus solicitarea și obțineți o imagine, puteți utiliza funcția de lux pentru a obține o copie la rezoluție mai mare. Există trei stiluri din care puteți alege: Artă, Fotografie și Desen. De asemenea, puteți selecta opțiunea „Niciuna” dacă doriți ca modelul să decidă.



  imagine generată de creioane

În plus, „Modul expert” vă permite să includeți cuvinte negative, ceea ce îi spune modelului să evite anumite elemente. Există, de asemenea, o funcție de predicție promptă, care folosește ChatGPT pentru a ajuta utilizatorii să scrie cele mai bune și mai detaliate solicitări posibile. În cele din urmă, funcțiile de eliminare a fundalului alimentate de AI vă pot ajuta să economisiți timp și efort prin tăierea fundalurilor din imagini.

Și cam asta face Craiyon. Nu este cel mai sofisticat model de generare de imagini AI, dar se descurcă bine ca model de bază dacă nu doriți ceva detaliat sau realist.





Utilizarea modelului este gratuită, dar utilizatorii gratuiti sunt limitati la nouă imagini gratuite simultan într-un minut. Vă puteți abona la nivelurile de susținător sau profesional (la prețul de 5 USD, respectiv 20 USD pe lună și facturat anual) pentru a nu primi reclame sau filigrane, generare mai rapidă și opțiunea de a păstra imaginile dvs. generate private. Un nivel de abonament personalizat permite, de asemenea, modele personalizate, integrare, asistență dedicată și servere private.

2 Difuziune stabilă 1.5

Stable Diffusion este poate unul dintre cele mai populare modele open-source de generare text-to-image. De asemenea, alimentează și alte modele, inclusiv cele trei generatoare de imagini menționate mai jos. A fost lansat în 2022 și a avut multe implementări de atunci.





  stabil-difuzie-web-ui

Vă voi scuti de detaliile prea tehnice ale modului în care funcționează modelul (pentru care puteți verifica lor depozitul oficial Github ), dar modelul este ușor de instalat chiar și pentru începători completi și funcționează bine atâta timp cât aveți un GPU dedicat cu cel puțin 4GB de memorie. De asemenea, puteți accesa Difuzie stabilă online și vă oferim acoperire dacă doriți rulați Stable Diffusion pe un Mac .

Există mai multe puncte de control (le considerați versiuni) disponibile pentru a fi utilizate pentru Stable Diffusion. În timp ce am testat versiunea 1.5, versiunea 2.1 este, de asemenea, în dezvoltare activă și este mai precis.

  dreamshaper-ai-generat-image
Yadullah Abidi/MakeUseOf/DreamShaper

Rularea modelului este, de asemenea, destul de ușoară. L-am testat cu AUTOMATIC1111 Stable Diffusion interfață de utilizator web , iar toate controalele și parametrii funcționează bine. Este, de asemenea, destul de rezistentă la NSFW datorită bazei de date LAION-5B pe care s-a antrenat modelul (deși nu este perfect, țineți cont). În timp ce timpul de generare în sine va varia în funcție de hardware-ul dvs., vă puteți aștepta ca imaginile dvs. să fie detaliate și realiste chiar și cu solicitări de bază.

3 DreamShaper

DreamShaper este un model de generare de imagini bazat pe Stable Diffusion. Acesta a fost conceput ca o alternativă open-source la MidJourney și se concentrează pe fotorealismul în imaginile generate, deși se poate descurca la fel de bine cu stilurile anime și pictura, cu câteva modificări.

Modelul este mai capabil decât Stable Diffusion, permițând utilizatorilor mai multă libertate în ceea ce privește rezultatul final, de la îmbunătățiri fulgerătoare până la restricții mai laxe ale NSFW. Rularea modelului este, de asemenea, ușoară, cu a versiune descărcabilă, pre-antrenată disponibilă online pentru acces local și o serie de site-uri web, inclusiv Sinkin.ai , RandomSeed , și Mage.spațiu (necesită un abonament de bază) care vă permite să rulați modelul cu accelerare GPU.

  dreamshaper-stablediffusion-comparation

După cum probabil puteți ghici până acum, imaginile generate de DreamShaper tind să arate mai realiste în comparație cu Stable Diffusion. Chiar dacă rulați același prompt pe ambele modele, modelul DreamShaper va fi probabil mai realist, mai detaliat și mai bine iluminat.

Acest lucru este valabil mai ales pentru portrete sau personaje, ceva ce mi-a lipsit Stable Diffusion în comparație cu același prompt. Dacă imaginile tale devin prea realiste, iată patru moduri de a identifica o imagine generată de AI .

Nici nu aveți nevoie de un PC uriaș pentru a rula modelul. GTX 1650Ti cu 4GB VRAM a rulat perfect modelul. Timpul de generare a fost puțin mai lung, dar nu părea să afecteze producția reală. Acestea fiind spuse, este posibil să aveți nevoie de GPU-uri cu mai multă VRAM pentru a rula DreamShaper XL, care se bazează pe modelul Stable Diffusion XL.

4 InvokeAI

Invoke AI este un alt model de generare de imagini bazat pe AI bazat pe Stable Diffusion, cu o versiune XL bazată pe Stable Diffusion XL. De asemenea, are propria sa interfață de utilizator web și linie de comandă, ceea ce înseamnă că nu va trebui să sari cu lucruri precum Stable Diffusion web UI.

  invokeai-user-interface-with-image

Modelul se concentrează pe a permite utilizatorilor să creeze imagini pe baza proprietății lor intelectuale cu fluxuri de lucru personalizate. InvokeAI este unul dintre cele mai bune modele open-source de generare de imagini AI pentru antrenarea modelelor personalizate și lucrul cu proprietatea intelectuală.

Este depozitul oficial Github enumeră două metode de instalare: instalarea prin programul de instalare al lui InvokeAI sau utilizarea PyPI dacă vă simțiți confortabil cu un terminal și Python și aveți nevoie de mai mult control asupra pachetelor instalate cu modelul.

Cu toate acestea, controlul suplimentar aduce câteva limitări, în special cerințe hardware mai stricte. InvokeAI recomandă un GPU dedicat cu cel puțin 4 GB de memorie, cu șase până la opt GB recomandate pentru rularea variantei XL. Cerințele VRAM se aplică atât GPU-urilor AMD, cât și Nvidia. De asemenea, veți avea nevoie de cel puțin 12 GB de RAM și 12 GB de spațiu liber pe disc pentru model, dependențele sale și Python.

  invoke-ai-generated-image
Yadullah Abidi/MakeUseOf/InvokeAI

Deși documentația nu recomandă GPU-urile Nvidia din seria GTX 10 și seria 16 din cauza lipsei lor de memorie video, programul de instalare furnizat a funcționat foarte bine. Deși kilometrajul dvs. poate varia, dacă sunteți pe un GPU de calitate inferioară, așteptați-vă mai mult pentru a vedea solicitările dvs. fiind transformate în imagini. În cele din urmă, dacă sunteți pe Windows, puteți utiliza doar un GPU Nvidia, deoarece în prezent nu există suport pentru GPU-urile AMD.

Pentru partea de generare a imaginii, modelul tinde să încline mai mult spre stiluri artistice decât spre fotorealism. Desigur, puteți antrena modelul pe setul dvs. de date și puteți genera imagini mai aproape de ceea ce doriți, chiar dacă asta implică imagini fotorealiste, mai ales dacă lucrați în design de produs, arhitectură sau spații de vânzare cu amănuntul. Cu toate acestea, un lucru important de reținut este că InvokeAI este în primul rând un motor de generare de imagini, ceea ce înseamnă că va trebui probabil să utilizați propriile modele pentru cele mai bune rezultate (găsesc ușor prin managerul de modele furnizat în interfața web) ca implicit modelul este destul de asemănător cu Stable Diffusion în sine.

5 Călătorie deschisă

Openjourney este un model de generare de imagini AI gratuit, open-source, bazat din nou pe Stable Diffusion. Dacă vă întrebați de ce modelul se numește Openjourney, este pentru că a fost antrenat pe imagini Midjourney și poate imita stilul său în imaginile pe care le generează.

PromptHero , compania din spatele Openjourney, vă permite să testați modelul alături de alte modele, inclusiv Stable Diffusion (versiunile 1.5 și 2), DreamShaper și Realistic Vision. Când vă înregistrați, obțineți 25 de credite gratuite (un credit pentru fiecare imagine generată), după care trebuie să vă abonați la nivelul lor de abonament Pro, care costă 9 USD pe lună și vă oferă acces la 300 de credite în fiecare lună cu alte funcții exclusive.

cum să faci crom să nu folosești atât de mult berbec
  openjourney-stablediffusion-comparation

Cu toate acestea, dacă doriți să-l rulați local și gratuit, puteți descărcați fișierul model de la HuggingFace și rulați-l folosind Stable Diffusion web UI. Openjourney este, de asemenea, al doilea cel mai descărcat model de generare de imagini AI pe HuggingFace, chiar după Stable Diffusion.

Openjourney nu listează cerințe hardware specifice pentru rularea modelului la nivel local pe site-ul său web, dar vă puteți aștepta la cerințe hardware similare cu Stable Diffusion. Aceasta înseamnă un GPU dedicat cu 4 GB VRAM, 16 GB RAM și aproximativ 12 până la 15 GB spațiu liber pe computer pentru a salva modelul și dependențele acestuia.

  openjourney-ai-generated-image
Yadullah Abidi/MakeUseOf/OpenJourney

Imaginile generate de Openjourney tind să fie echilibrate între fotorealism și artă, dacă nu se specifică altfel. Dacă sunteți în căutarea unui model complet și preferați aspectul și senzația Midjourney fără a plăti abonamentul, Openjourney este una dintre cele mai bune opțiuni.