ChatGPT : l’IA se dote de capacités de conversations orales fluides
La nouvelle mise à jour de « Voice Mode » de ChatGPT réplique de manière saisissante les conversations humaines. Avez-vous déjà expérimenté une interaction aussi fluide avec une intelligence artificielle?
Tl;dr
- OpenAI dévoile ChatGPT amélioré, GPT-4o.
- ChatGPT intégrera texte, son et images.
- Disponibilité progressive pour abonnés et utilisateurs gratuits.
- IA générative révolutionne l’industrie technologique.
Une avancée spectaculaire dans l’intelligence artificielle
Les chercheurs ne cessent de repousser les frontières de l’intelligence artificielle, et OpenAI vient de franchir une nouvelle étape majeure.
Ce lundi, l’entreprise a présenté une version améliorée de ChatGPT, nommée GPT-4o, qui révolutionne les interactions avec les utilisateurs en rendant les conversations orales et écrites encore plus fluides et naturelles.
Les nouvelles capacités de ChatGPT : Compréhension multimodale
Avec GPT-4o, ChatGPT ne se limite plus au texte ; il peut désormais comprendre et générer du son et des images. Cette évolution permet une interaction plus riche et diversifiée. Les utilisateurs pourront interagir avec l’IA via :
- Texte
- Voix
- Images
Ces capacités seront progressivement mises à disposition. D’abord pour les abonnés payants et ensuite pour les utilisateurs gratuits, bien que des limitations d’usage puissent s’appliquer.
Expériences immersives : une démonstration impressionnante
Lors d’une démonstration vidéo en direct, ChatGPT a pu interpréter les émotions des utilisateurs à partir des images capturées par la caméra d’un smartphone. Plusieurs applications pratiques ont été mises en évidence, notamment :
- Guidance lors d’exercices de respiration
- Récit d’histoires
- Aide à la résolution de problèmes mathématiques
Les utilisateurs ont également la possibilité d’interrompre l’IA facilement, rendant l’interaction encore plus naturelle.
Un tournant dans la course à l’IA
Le lancement de cette nouvelle version marque une nouvelle étape dans la course effrénée à l’IA dans Silicon Valley. Depuis la sortie de ChatGPT fin 2022, qui a bouleversé l’industrie technologique, de nombreux acteurs comme Google et Microsoft ont suivi le mouvement avec leurs propres avancées. Google doit d’ailleurs dévoiler ses dernières innovations technologiques très prochainement.
Sam Altman, le directeur général d’OpenAI, a souvent exprimé son admiration pour le film de science-fiction *Her*, où un homme développe une relation avec une IA en l’interpellant oralement. Il précise que ce film a été “incroyablement prophétique” et a inspiré le développement de ChatGPT, tant par sa vision d’un assistant personnalisé que par son interaction fluide avec les utilisateurs.
Perceptions et perspectives
Bien que ChatGPT ne soit pas encore à la hauteur des agents d’IA omniscients et proactifs promis par certaines entreprises, la mise à jour GPT-4o a déjà suscité des réactions mi-enthousiasmées, mi-inquiètes parmi les experts du secteur.
Il reste indéniable qu’à chaque mise à niveau, l’intelligence artificielle se rapproche de plus en plus de ce que l’on envisageait autrefois comme de la pure science-fiction.