MusicLM de la Google este la înălțimea hype-ului?

MusicLM de la Google este la înălțimea hype-ului?
Cititorii ca tine ajută la sprijinirea MUO. Când efectuați o achiziție folosind link-uri de pe site-ul nostru, este posibil să câștigăm un comision de afiliat. Citeşte mai mult.

În ianuarie 2023, Google a anunțat MusicLM, un instrument experimental AI care ar putea genera muzică pe baza descrierilor de text. Pe lângă știri, Google a lansat o lucrare de cercetare uimitoare pentru MusicLM, care a lăsat mulți oameni uimiți de capacitatea de a evoca muzica din aer.





REALIZAREA VIDEOCLIPULUI ZILEI Derulați PENTRU A CONTINUA CU CONȚINUT

Având un mesaj text, modelul a promis că va produce muzică de înaltă fidelitate, care oferă tot felul de descrieri, de la gen la instrument, până la subtitrări abstracte care descriu opere de artă celebre. Acum că MusicLM este deschis publicului, am decis să-l punem la încercare.





Încercarea Google de a crea un generator de muzică AI

  Aplicație web pentru Google's MusicLM AI music generator

Transformarea unui mesaj text precum „jazz relaxant” într-o piesă gata de redat este, fără îndoială, sfântul Graal al experimentelor în muzica AI. Similar cu generatoarele celebre de imagini AI, cum ar fi Dall-E sau Midjourney, nu este nevoie să aveți un pic de cunoștințe muzicale pentru a produce o piesă care are o melodie și ritm.





În mai 2023, cei care s-au înscris la Google AI Test Kitchen au putut încerca demo pentru prima dată. Întâmpinat de o pagină web ușor de utilizat și de câteva reguli directoare — instrumentele electronice și clasice funcționează cel mai bine și nu uitați să specificați o „vibe” — producerea unui fragment de muzică este inimaginabil de ușor.

Viteza este unul dintre puținele lucruri pe care MusicLM le oferă cu adevărat, alături de mostre de fidelitate relativ ridicată. Cu toate acestea, adevăratul test nu trebuia măsurat doar cu un cronometru. MusicLM poate produce muzică reală, care poate fi ascultată, bazată pe câteva cuvinte? Nu tocmai (vom ajunge la asta în curând).



Cum să utilizați MusicLM în bucătăria de testare AI Google

Utilizarea MusicLM este simplă, vă puteți înscrie pe lista de așteptare Bucătăria de testare AI de la Google dacă vrei să încerci.

În aplicația web, veți vedea o casetă de text în care puteți compune o solicitare de la câteva cuvinte la câteva propoziții care descriu tipul de muzică pe care doriți să o auziți. Pentru cele mai bune rezultate, Google vă sfătuiește să „fiți foarte descriptiv”, adăugând că ar trebui să încercați să includeți starea de spirit și emoția muzicii.





Când sunteți gata, apăsați Enter pentru a începe procesarea. În aproximativ 30 de secunde, două fragmente audio vor fi disponibile pentru audiție. Dintre cele două, aveți opțiunea de a acorda un trofeu celui mai bun eșantion care se potrivește cu solicitarea dvs., ceea ce, la rândul său, ajută Google să antreneze modelul și să-și îmbunătățească randamentul.

Cum sună MusicLM

Oamenii fac muzică de acum cel puțin 40.000 de ani, fără nicio idee definitivă dacă muzica a apărut înainte, după sau în același timp cu dezvoltarea limbajului. Deci, în anumite privințe, nu este surprinzător că MusicLM nu a descifrat codul acestei arte universale străveche.





Lucrarea de cercetare MusicLM de la Google a sugerat că MusicLM ar putea genera muzică din subtitrări aparținând unor opere de artă celebre și să urmeze instrucțiuni precum schimbarea genului sau a dispoziției într-un mod fluid, urmând o succesiune de solicitări diferite.

Cu toate acestea, înainte de a ajunge la comenzi atât de mari, am constatat că MusicLM avea câteva probleme fundamentale de depășit mai întâi.

Dificultatea de a se ține de tempo

Cea mai de bază treabă a oricărui muzician este pur și simplu să cânte la timp. Cu alte cuvinte, rămâneți la tempo. În mod surprinzător, acesta nu este ceva ce MusicLM îl poate face 100% din timp.

De fapt, folosind același prompt de 10 ori, care produce 20 de piese muzicale, doar trei au fost la timp. Celelalte 17 mostre au fost mai rapide sau mai lente decât tempo-ul specificat, care a fost scris în „bătăi pe minut”, un termen folosit pe scară largă pentru a descrie muzica.

În acest exemplu, am folosit promptul „pian clasic solo cântat la 80 de bătăi pe minut, pașnic și meditativ”. La o ascultare mai atentă, muzica a accelerat sau a încetinit adesea în intervalul mic de eșantion.

De asemenea, muzicii îi lipsea un ritm puternic și suna ca și cum cineva ar fi apăsat pe play la jumătatea piesei. Indiferent dacă acest lucru a fost intenționat sau nu, este dificil să se judece dacă MusicLM poate compune într-adevăr un început sau un sfârșit adecvat pentru o piesă muzicală, pe lângă faptul că rămâne la ritm.

Selectarea aleatorie a instrumentului

Poate că MusicLM nu învățase încă cum să cânte în timp strict, așa că am trecut la un alt parametru muzical comun. Am vrut să vedem dacă ne va acorda cererea pentru anumite instrumente.

Am scris mai multe solicitări diferite care au inclus descrieri precum „Sintetizator solo” și „Chitara bas solo”. Alții erau ansambluri mai mari precum „String Quartet” sau „Jazz Band”. În ansamblu, părea o șansă de 50:50 să obții ceea ce ai cerut.

O teorie este că modelul asociază unele instrumente cu genuri muzicale populare. Luați, de exemplu, promptul „Sintetizator solo, progresia acordurilor. Vioi și optimist”. În loc să obțină un sunet de sintetizator singur, MusicLM a produs o piesă electronică completă cu tobe și bas.

Este posibil ca modelul să nu aibă suficiente date și suficientă pregătire pentru a înțelege cererea specifică pentru un instrument.

Vocile sunt în afara ecuației

Conform restricțiilor de la acea vreme, modelul nu ar produce muzică care conține voce. Problemele spinoase ale drepturilor de autor ale MusicLM și vocea greșită este un factor probabil în motivul pentru care Google a ales să joace în siguranță prin stabilirea acestei limitări.

Dar, după ce am experimentat cu MusicLM de ceva timp, ne-am dat seama că controlul Google asupra producției modelului nu a fost tocmai fermecat. În mod ciudat, un prompt precum „chitara acustică” ar produce o piesă care conținea voce fantomă în fundal, care suna înfundat și îndepărtat.

Deși acest lucru nu este o întâmplare obișnuită, te lasă să te întrebi despre capacitatea MusicLM de a crea voci convingătoare în primul rând.

Cu software-uri precum VOCALOID și Synthesizer V, care conduc la intrare Tehnologie de sinteză vocală asistată de inteligență artificială , omiterea vocii din modelul actual ne face să ne întrebăm dacă nu este încă suficient de bun pentru a concura cu tehnologia existentă. MusicLM ar putea avea un drum lung de parcurs înainte ca muzicienii să-și laude.

Viitorul generatoarelor de muzică AI

  Diferite sugestii prompte despre MusicLM's web application

În timp ce MusicLM a avansat tehnologia muzicală generativă AI, trebuie să se întoarcă la școală și să învețe mai multe lucruri înainte de a-și putea ocupa munca practică în industria muzicală.

Până acum, cea mai bună încercare de muzică AI generativă a fost un model numit JukeboxAI de OpenAI. Nu era chiar într-o stare gata de utilizare și a fost nevoie de nouă ore pentru a reda doar un minut de muzică.

care este diferența dintre un televizor și un monitor

Pentru eforturile tale, probabil că vei recupera o piesă cu sunet cu adevărat extraterestră, plină de distorsiuni audio și artefacte. În plus, nu aveai de gând să te plictisești ascultând creațiile bizare pe care le evocă Jukebox .

În lumina acestui fapt, MusicLM a făcut unele progrese semnificative către un generator de muzică AI ușor de utilizat. Aproape că am putea ierta modelul pentru ieșirile sale aleatorii când te oprești să te gândești cât de complicat este să generezi muzică sub formă audio brută.

Cu toate acestea, după ce a pus modelul la lucru, MusicLM se simte pe jumătate copt în comparație cu ceea ce a publicat Google în lucrarea sa de cercetare inițială. Rareori un generator de imagini AI obține imaginea unui Apple greșit, de asemenea, un generator de muzică AI ar trebui să înțeleagă câteva elemente de bază, cum ar fi tempo și instrumente.

MusicLM de la Google nu face față așteptărilor

Cu companiile de tehnologie care se întrec între ele pe frontul AI, MusicLM se simte ca și cum ar fi intrat în probe publice înainte de a fi gata. În loc să înțeleagă corect fundamentele, modelul pare să adopte o abordare mult mai vagă și subiectivă a producerii muzicii.

Google vă poate încuraja să fiți specific cu solicitarea dvs., dar nu poate gestiona bine tempo și nu aveți garanția că veți obține instrumentele pe care le-ați cerut de fiecare dată. MusicLM poate fi interesant și o bună demonstrație a progreselor puternice ale AI, dar dacă muzica este scopul final, mai are un drum lung de parcurs.