ChatGPT ima veliku nadogradnju: može vidjeti, čuti i govoriti (VIDEO)

- Advertisement -

OpenAI najavljuje pokretanje glasovnih razgovora s chatbotom za iOS i Android sustave ili dijeljenje slika/fotografija na svim platformama kako bi se izrazile misli, umjesto samog oslanjanja isključivo na upisivanje upita. Ove nove opcije bit će dostupne Plus i Enterprise korisnicima u sljedeće dvije sedmice. Ali Open AI planira ubrzo proširenje usluga na besplatne verzije aplikacija.

Glasovni unos upita

Funkcija glasovnog unosa slična je glasovnom asistentu na mobilnom telefonu. Korisnici samo trebaju pritisnuti gumb i izgovoriti svoje pitanje, a ChatGPT će ga pretvoriti u tekst, poslati veliki jezični model, potom generirati odgovor i pretvoriti ga u govor te reproducirati korisniku. Za glasovnu značajku, OpenAI koristi Whisper, svoj sustav za prepoznavanje govora, transkripciju izgovorenih riječi korisnika u tekst i novi model teksta u govor koji može generirati zvuk sličan ljudskom sa samo nekoliko sekundi govora. Ujedno je tvrtka surađivala s profesionalnim glumcima kako bi stvorila pet glasova ChatGPT-a. OpenAI dijeli ovaj model pretvaranja teksta u govor s nekolicinom drugih tvrtki, uključujući Spotify koji ga koristi za prevođenje podcasta slavnih osoba.

- OGLAS -

Prema OpenAI-ju, ova nova tehnologija govora može proizvesti realističan sintetički govor iz nekoliko sekundi pravog govora, otvarajući vrata mnogim kreativnim i pristupačnim aplikacijama. Međutim, ove mogućnosti također stvaraju nove rizike, kao što je mogućnost da se zlonamjerni akteri lažno predstavljaju kao javne osobe ili počine prijevaru. Zato će biti biti strogo kontroliran i ipak ograničen.

- OGLAS -

Razgovor o slikama/fotografijama

Funkcija unosa slike je nešto poput Google Lens. Korisnici mogu fotografirati stvari koje ih zanimaju i prenijeti ih na ChatGPT. AI će ih analizirati i na temelju analize pokušati identificirati što korisnik želi pitati te ponuditi odgovor. Korisnici također mogu koristiti alate za crtanje u aplikaciji kako bi lakše izrazili svoja pitanja ili vodili pomoćnika, ali moguće je koristiti i govor ili upisivati pitanja koja idu uz učitanu sliku.

- OGLAS -

Sposobnost ChatGPT-a za prepoznavanje slika već je isprobana od strane tvrtke pod nazivom Be My Eyes, koja izrađuje aplikaciju za osobe s oštećenim vidom. Vrijedno je spomenuti da je OpenAI također poduzeo tehničke mjere kako bi značajno ograničio sposobnost ChatGPT-a da analizira i izravno predstavlja druge, jer ChatGPT nije uvijek točan i ti bi sustavi trebali poštovati osobnu privatnost.

- OGLAS -

Granice usporavaju biznis u BiH: Privreda gubi više od milijardu KM godišnje

Hrvatska pooštrava uvjete za strane radnike: Obavezno poznavanje jezika i vakcinacija

Ukrajina na rubu bankrota: Potrebno 137 milijardi dolara za naredne dvije godine

BiH pred Evropskim vijećem: Negativan izvještaj o reformama uz par pohvala

Porezna uprava FBiH izvršila 262 kontrole i zapečatila 30 objekata

Pročitajte još

Ruski naučnici upozorili: Snažna magnetna oluja pogodit će Zemlju

Skandal za Google: Novi Pixel 10 Pro Fold eksplodirao tokom testa savijanja

Novi ChatGPT pod lupom: Istraživanje otkrilo opasne savjete i propuste u sigurnosti

Prvi tragovi nove ere gaminga – šta sve donosi PlayStation 6

NAJNOVIJEFACE.BA

Četvorici reprezentativaca BiH porasla vrijednost, evo ko je “najskuplji”

Još jedan klub želi Dijamanta! Za kog će Džeko potpisati?

Nova muzička “poslastica” za fanove: Kultur Shock objavio novi album „House of Kultur“

Protesti poljoprivrednika u Briselu: Veliki neredi i blokade

Prevrnuo se automobil kod Trebinja: Kineski državljanin fotografisao panoramu

Ove sarajevske ulice danas nemaju vode

BOSANSKI VJESTNIK – 17. 12. 2025.

Kulauzović za FACE TV: “Al Ahmed je heroj za australsku vladu zbog razoružavanja napadača!”

Udišemo smrtonosne čestice, a za online nastavu “nisu stečeni uslovi” Proglašeno “upozorenje” u KS!

Vulić oplela po opoziciji, Šmitu, ali i koalicionim partnerima SNSD-a u RS-u: “Glume da nas vole!”