OpenAI oferă ChatGPT o voce pentru a răspunde la solicitări și comenzi

Cititorii ca tine ajută la sprijinirea MUO. Când efectuați o achiziție folosind link-uri de pe site-ul nostru, este posibil să câștigăm un comision de afiliat. Citeşte mai mult.

ChatGPT este setat să devină o experiență interactivă generativă AI. OpenAI a dezvăluit că cel mai important chatbot AI din lume va fi capabil să vorbească și să răspundă la întrebările utilizatorilor folosind o voce sintetizată, probabil generată de AI.

cum se conectează iPhone la LG TV folosind USB

Alături de noua sa voce, ChatGPT va putea, de asemenea, să răspundă și să discute despre anumite imagini încărcate pe acesta sau realizate în timp ce folosește aplicația ChatGPT pentru Android sau iOS. Funcția de recunoaștere a imaginii sună similar cu Google Lens și cu alte aplicații care folosesc rețele neuronale pentru a detecta datele și informațiile cu acuratețe.

OpenAI oferă ChatGPT o voce

Pe 25 septembrie 2023, dezvoltator ChatGPT OpenAI a dezvăluit ar oferi o voce chatbot-ului său generativ AI, lider mondial. Utilizatorii ChatGPT pot vorbi direct cu chatbot-ul și pot solicita acestuia să răspundă, permițând efectiv ChatGPT să converse direct cu vocea pentru prima dată.

Exemplul de clip OpenAI prezintă o femeie care cere ChatGPT să creeze o poveste unică înainte de culcare, la care ChatGPT răspunde în mod corespunzător cu o voce feminină sintetizată.

Conform Cablat , noul model text-to-speech a fost dezvoltat intern. Poate genera sunet „asemănător unui om” din text și câteva secunde de exemplu de vorbire ( folosind modelul OpenAI Whisper ) și vorbesc în diverse tonuri și stiluri. Puteți găsi o gamă de mostre de voce pe Blogul lui OpenAI .

Unele companii folosesc deja noul model de voce OpenAI. De exemplu, Spotify folosește modelul text-to-speech al OpenAI pentru a traduce podcasturi în diferite limbi, combinând priceperea de traducere a limbilor ChatGPT cu noua sa capacitate de vorbire.

Noul model text-to-speech al ChatGPT este disponibil numai pentru abonații Plus și Enterprise care folosesc aplicațiile oficiale pentru Android și iOS și este de așteptat să fie lansat în următoarele două săptămâni (începând cu 25 septembrie 2023). În plus, noua funcție de voce este limitată la engleză pentru început, deși ne-am aștepta ca acest lucru să se schimbe rapid.

ChatGPT poate recunoaște și și fotografii

A doua parte a actualizării ChatGPT de la OpenAI este capacitatea de a analiza și vorbi imaginile încărcate în instrument. Opțiunea de analiză vizuală a imaginii a fost prezentată în videoclipurile de actualizare GPT-4, dar nu a mai fost discutată prea mult de atunci ( Interpretul de cod ChatGPT deoparte ).

cum pot obține Microsoft Word pe computerul meu

Acum, ChatGPT câștigă funcționalități similare cu Google Lens. Puteți încărca o imagine în ChatGPT sau puteți face o fotografie folosind camera smartphone-ului în aplicația ChatGPT și va detalia imaginea, adăugând mai mult context acolo unde este necesar.

Numirea lui „similar cu Google Lens” face o nedreptate, într-adevăr. Abilitatea de a discuta înainte și înapoi despre imagine pentru a obține mai multe informații și context o face extrem de utilă pentru o gamă largă de setări. Cu toate acestea, este important să rețineți că literele mici, OpenAI clarificând că a limitat „capacitatea ChatGPT de a analiza și de a face declarații directe despre oameni” din motive de confidențialitate și acuratețe. Totuși, ar putea un instrument „Cine este acesta” alimentat de OpenAI să fie în lucru pentru viitor? (Să sperăm că nu!)

La fel ca noul model text-to-speech, OpenAI va lansa recunoașterea imaginilor în următoarele două săptămâni, deși va fi disponibil pe toate platformele, nu doar pe aplicația ChatGPT.

Confidențialitate, securitate și alte probleme

Implicațiile unui ChatGPT cu voce sunt grave. Sigur, este incitant. Cu toate acestea, capacitatea de a crea o voce sintetizată în mod unic folosind doar un scurt fragment ca exemplu are probleme considerabile de confidențialitate și securitate. Potențialul actorilor rău intenționați de a exploata aceste instrumente este enorm și, la fel ca în cazul oricărui instrument generativ de inteligență artificială, odată ce geniul iese din sticlă, absolut nu se va întoarce. Nicio cantitate de reglementare AI din partea guvernelor sau a liderilor de gândire nu se poate întoarce. mareea.

Chiar și avertismentul OpenAI pe această temă pare să ocolească ceea ce este evident, în ciuda menționării problemelor:

Cu toate acestea, aceste capabilități prezintă, de asemenea, noi riscuri, cum ar fi potențialul actorilor rău intenționați de a uzurpa identitatea unor personalități publice sau de a comite fraude. Acesta este motivul pentru care folosim această tehnologie pentru a alimenta un anumit caz de utilizare - chatul vocal.
cum să-mi fac laptopul mai rapid Windows 10

Având în vedere că acesta este vârful aisbergului, așteptați-vă la refuz împotriva noii voci a lui ChatGPT, mai ales odată ce există o creștere previzibilă a titlurilor neplăcute care susțin că ChatGPT este folosit pentru a comite fraude și așa mai departe.

OpenAI face din ChatGPT aplicația Go-To AI

Cu cât OpenAI adaugă mai multe funcții ușor de utilizat la ChatGPT, cu atât mai mult devine aplicația AI generativă. Fiind primul care a atins faima pe scară largă în timpul boom-ului generativ inițial al AI, ChatGPT încă conduce și este singura aplicație pe care o folosește, în ciuda concurenței dintre Google Bard (și potențial Google Gemini) și Claude lui Anthropic.

Atâta timp cât OpenAI poate continua să adauge funcții care fac ChatGPT mai ușor de utilizat, îi va ține pe oameni captivați și va împinge din ce în ce mai mult de obiectivul său de un instrument AI cu adevărat multimodal.