Amazon onthult Nova Sonic, een AI-spraakmodel dat realtime spraakverwerking en natuurlijke spraakgeneratie combineert. Volgens Amazon kan Sonic concurreren met de spraakmodellen van OpenAI en Google op het vlak van snelheid, spraakherkenning en gesprekskwaliteit.
Volgens Amazon is Nova Sonic ‘het kostenefficiëntste AI-spraakmodel op de markt’. Het model zou bijna 80 procent goedkoper zijn dan GPT-4o van OpenAI. Amazon zegt dat de combinatie van spraakbegrip en spraakgeneratie in één model het mogelijk maakt om ‘mensachtigere gesprekken mogelijk te maken in AI-toepassingen’. Het model kan onder meer menselijke gesprekspatronen herkennen zoals pauzes, aarzelingen en onderbrekingen.