Tehnologija

OpenAI uvodi nove glasovne funkcije u svoj API

OpenAI je predstavio nove glasovne inteligentne funkcije u svom API-ju koje omogućavaju aplikacijama da razgovaraju, transkribuju i prevode razgovore u realnom vremenu.

Novi model GPT-Realtime-2 donosi realističnu simulaciju glasa sa naprednim GPT-5 razmišljanjem, sposoban da odgovori na složenije zahtjeve korisnika. Uz to, GPT-Realtime-Translate omogućava simultani prijevod preko 70 ulaznih i 13 izlaznih jezika, dok GPT-Realtime-Whisper pruža live transkripciju govora u tekst.

Ove funkcije su posebno korisne za kompanije koje žele unaprijediti korisničku podršku, ali i za obrazovanje, medije, događaje i platforme za kreatore sadržaja. OpenAI je uveo zaštitne mjere kako bi spriječio zloupotrebu, uključujući zaustavljanje razgovora koji krše smjernice o štetnom sadržaju.

Sve nove glasovne mogućnosti dostupne su kroz OpenAI Realtime API, naplaćuju se po minuti ili tokenima, i predstavljaju značajan korak ka glasovnim interfejsima koji ne samo da komuniciraju, već i razumiju i djeluju tokom razgovora.

Možda će Vas zanimati i:

Back to top button