Le président d’OpenAI partage la première image générée par GPT-4o | Dmshaulers

Le président d'OpenAI partage la première image générée par GPT-4o

Rejoignez-nous à notre retour à New York le 5 juin pour collaborer avec les hauts dirigeants afin d’explorer des méthodes complètes d’audit des modèles d’IA en termes de biais, de performances et de conformité éthique dans diverses organisations. Découvrez comment vous pouvez participer ici.


Greg Brockman, président d’OpenAI a écrit depuis son compte X ce qui semble être la première image publique générée à l’aide du tout nouveau modèle GPT-4o de l’entreprise.

Comme vous pouvez le voir dans l’image ci-dessous, c’est d’un photoréalisme assez convaincant, montrant une personne portant un T-shirt noir avec un logo OpenAI écrivant un texte à la craie sur un tableau noir qui dit “Transfert entre modalités”. Supposons que nous modélisions directement P (texte, pixels, son) avec un gros transformateur autorégressif. Quels sont les avantages et les inconvénients ? »

Le nouveau modèle GPT-4o, qui a fait ses débuts lundi, améliore la précédente famille de modèles GPT-4 (GPT-4, GPT-4 Vision et GPT-4 Turbo) en étant plus rapide, moins cher et en conservant plus d’informations provenant d’entrées telles que le son et la vue.

Il est capable de le faire parce qu’OpenAI a adopté une approche différente de celle de ses précédents LLM de classe GPT-4. Alors que ceux-ci enchaînaient plusieurs modèles différents et convertissaient d’autres médias tels que l’audio et les visuels en texte et inversement, le nouveau GPT-4o a été formé dès le départ sur les jetons multimédias, permettant d’analyser et d’interpréter directement la vue et le son sans les convertir au préalable. écrire un SMS.

événement VB

Visite d’impact de l’IA : audit de l’IA

Rejoignez-nous à notre retour à New York le 5 juin pour dialoguer avec les hauts dirigeants et vous plonger dans les stratégies d’audit des modèles d’IA afin de garantir l’équité, les performances optimales et la conformité éthique dans diverses organisations. Sécurisez votre entrée à cet événement exclusif sur invitation uniquement.

Demander une invitation

Sur la base de l’image ci-dessus, la nouvelle approche constitue une amélioration notable par rapport au dernier modèle de génération d’images d’OpenAI, DALL-E 3, qui a fait ses débuts en septembre 2023. J’ai exécuté une invite similaire via DALL-E 3 dans ChatGPT et voici le résultat.

Comme vous pouvez le constater, l’image partagée par Brockman créée avec GPT-4o s’améliore considérablement en termes de qualité, de photoréalisme et de précision de génération de texte.

Cependant, les capacités natives de génération d’images de GPT-4o ne sont pas encore accessibles au public. Comme Brockman l’a mentionné dans son post X en disant “L’équipe travaille dur pour les amener au monde.”

Leave a Reply

Your email address will not be published. Required fields are marked *