OpenAI heeft zojuist GPT-4o onthuld, een upgrade van hun chatbot die veel natuurlijker kan communiceren. GPT-4o kan beelden en geluid in real-time verwerken, waardoor het net als een mens op jouw acties kan reageren.
OpenAI’s GPT-4o
In demonstraties laat OpenAI zien hoe GPT-4o je kan helpen met allerlei zaken. Zo kan het je helpen voorbereiden op een sollicitatiegesprek door te controleren of je er netjes uitziet, of een klantenservicemedewerker bellen om een nieuwe iPhone voor je te regelen.
Maar GPT-4o kan nog veel meer. Het kan flauwe vadergrappen vertellen, realtime vertalen, scheidsrechter spelen bij een potje steen-papier-schaar, of zelfs sarcastisch reageren. In een demonstratie wordt GPT-4o zelfs voorgesteld aan de puppy van de gebruiker. “Hallo lieve Bowzer! Wat ben je ontzettend schattig!” roept de chatbot enthousiast.
“Het voelt alsof sciencefiction werkelijkheid wordt,” zei OpenAI’s CEO Sam Altman in een blogpost op 13 mei. “Dat de reactiesnelheid en expressiviteit nu menselijk aanvoelen, is een enorme stap voorwaarts.”
Op 13 mei werd alvast een versie gelanceerd die tekst en afbeeldingen kan verwerken. De volledige versie met audio volgt binnenkort. GPT-4o zal beschikbaar zijn voor zowel gratis als betalende ChatGPT-gebruikers via de API van ChatGPT.
De “o” in GPT-4o staat voor “omni,” wat verwijst naar de ambitie om natuurlijke mens-computerinteracties te bevorderen.
Ongekende snelheid en precisie
Een enorme vooruitgang ten opzichte van eerdere OpenAI-tools is dat GPT-4o alle vormen van input (tekst, geluid en beeld) tegelijkertijd kan verwerken. Eerdere modellen zoals ChatGPT-4 “verloren vaak informatie” bij multitasken.
OpenAI claimt dat GPT-4o “vooral beter is in het begrijpen van beeld en geluid” dan bestaande modellen. Het kan zelfs emoties en ademhalingspatronen herkennen. Daarnaast is GPT-4o “veel sneller” en “50% goedkoper” dan GPT-4 Turbo in de OpenAI API.
Volgens OpenAI kan de nieuwe AI-tool binnen 2,3 seconden reageren op audio-input, met een gemiddelde van 3,2 seconden. Dit komt dicht in de buurt van hoe snel mensen normaal gesproken reageren in een gesprek.
Het bericht Nieuwe update van OpenAI: ChatGPT kan nu livestreamen en reageert als een mens verscheen eerst op Newsbit.