Depuis le 21 mai 2024, de nouveaux modèles d’IA rejoignent Microsoft Azure AI. GPT-4o et GPT-4 Turbo sont désormais disponibles dans Azure AI Studio et en tant qu’interface de programmation d’applications (API). Phi-3-vision, un nouveau modèle rentable, est également devenu disponible dans Azure.
GPT-4o
GPT-4o est le plus récent et le plus puissant des grands modèles de langage (LLM) de l’OpenAI.
Voici quelques précisions :
Intégration multimodale :
- Le GPT-4o traite simultanément du texte et des images.
- Cette approche multimodale établit une nouvelle norme pour l’IA en améliorant la précision et la réactivité des interactions entre l’homme et l’ordinateur.
- Des capacités telles que la reconnaissance audio et vidéo pourraient être ajoutées à l’avenir.
Accéder à GPT-4o :
- Pour utiliser le modèle GPT-4o, créez ou utilisez une ressource existante dans une région standard prise en charge ou une région standard mondiale où le modèle est disponible.
- Une fois votre ressource configurée, déployez le modèle GPT-4o en utilisant le nom “gpt-4o” et la version “2024-05-13” (ou la dernière version disponible).
GPT-4 Turbo
GPT-4 Turbo est un LLM qui accepte à la fois des entrées de texte et d’image, générant des réponses textuelles.
Les points forts du GPT-4 Turbo :
- GPT-4 Turbo surpasse ses prédécesseurs, y compris GPT-3.5 Turbo et les anciens modèles GPT-4.
- Il excelle dans les interactions par chat et les tâches traditionnelles.
- Le GPT-4 Turbo est inférieur au GPT-4o et est l’ancien modèle.
Différences entre Azure et OpenAI :
- Alors que la version d’OpenAI du dernier modèle turbo 0409 prend en charge le mode JSON et l’appel de fonction pour toutes les demandes d’inférence, la version d’Azure OpenAI ne prend actuellement pas en charge ces fonctionnalités avec l’entrée d’images.
- Toutefois, les demandes de saisie de texte prennent en charge le mode JSON et l’appel de fonctions.
Comparaison entre GPT-4 Turbo et GPT-4o
- Pour les textes en anglais et les tâches de codage, GPT-4o égale les capacités de GPT-4 Turbo.
- Cependant, le GPT-4o se distingue véritablement par ses performances supérieures dans les langues autres que l’anglais et dans les tâches de vision. Les tâches de vision font référence à un ensemble d’activités de vision par ordinateur qui impliquent le traitement et la compréhension de données visuelles, telles que des images ou des vidéos. Ces tâches permettent aux machines de “voir” et d’interpréter les informations visuelles, à l’instar de la vision humaine.
Le tableau ci-dessous montre d’autres différences:
Fonctionnalité | GPT-4 Turbo | GPT-4o |
Types d’entrées | Texte et image | Texte, image (la reconnaissance audio et vidéo pourrait s’ajouter à l’avenir) |
Optimisé pour | Interactions par chat et tâches traditionnelles | Tâches multimodales incluant les langues non anglaises et la vision |
Performance | Grande précision dans la résolution des problèmes | Performances supérieures dans les langues autres que l’anglais et dans les tâches visuelles |
Temps de latence | Latence élevée (non préférée – temps nécessaire au modèle pour répondre après avoir reçu une entrée) | Temps de latence plus faible (de préférence) |
Débit | Vitesse de génération de texte standard : 20 jetons par seconde | Vitesse de génération de texte plus rapide : 109 jetons par seconde |
Coût | 2,0x plus cher | Plus rentable |
Versions du modèle | gpt-4 (turbo-2024-04-09) | gpt-4o (2024-05-13) |
GPT-4o est supérieur à tous points de vue. L’utilisation de GPT-4 Turbo n’a de sens que si vos systèmes sont déjà optimisés pour ce modèle.
Phi-3-vision
Phi-3-vision est le premier modèle multimodal (reconnaissance de texte et d’image) de la famille Phi-3.
La famille Phi-3 est une collection de petits modèles de langage (SLM) d’IA développés par Microsoft. Ils sont puissants et très rentables.
Capacités de Phi-3-vision :
- Il est conçu pour raisonner sur des données du monde réel, en traitant de manière transparente à la fois le texte et les images.
- Par rapport aux autres modèles Phi-3, les utilisateurs peuvent se renseigner sur des données visuelles, comme des graphiques, ou poser des questions ouvertes sur des images spécifiques.
- Il a été développé conformément aux principes de Microsoft en matière d’intelligence artificielle responsable.
Voici une comparaison des modèles Phi-3:
Types de modèles | Paramètres | Longueurs contextuelles | Proposition de vente unique (USP) |
Phi-3-vision | 4,2 milliards d’euros | 128K | Le seul modèle Phi-3 qui comprend les images |
Phi-3-mini | 3,8 milliards d’euros | 128K / 4K | Compact et efficace |
Phi-3-small | 7,0 milliards d’euros | 128K / 8K | Polyvalent pour diverses tâches liées à l’IA |
Phi-3-medium | 14,0 milliards d’euros | 128K / 4K | Traitement avancé pour les tâches complexes |
Vous pouvez accéder à Phi-3-vision ici.
Prêt à libérer la puissance de ces nouveaux modèles dans Azure ?
Découvrez les modèles de pointe – GPT-4o, GPT-4 Turbo et Phi-3-vision – désormais disponibles dans Azure AI. Que vous plongiez dans les tâches multimodales, que vous amélioriez la collaboration ou que vous optimisiez la rentabilité, ces modèles sont votre porte d’entrée vers l’avenir de l’IA.
Commencez dès aujourd’huien contactant SCHNEIDER IT MANAGEMENTpour vos besoins en Microsoft Azure!
Plus d’informations
Pour l’annonce, veuillez consulter : https://blogs.microsoft.com/blog/2024/05/21/whats-next-microsoft-build-continues-the-evolution-and-expansion-of-ai-tools-for-developers/#:~:%20frontier%%20and,in%%20AI%.
Pour plus d’informations sur Phi-3-vision dans Azure, veuillez consulter : https://azure.microsoft.com/en-us/blog/new-models-added-to-the-phi-3-family-available-on-microsoft-azure/.
Pour plus d’informations sur GPT-4o dans Azure AI, veuillez consulter : https://azure.microsoft.com/en-us/blog/introducing-gpt-4o-openais-new-flagship-multimodal-model-now-in-preview-on-azure/.
Pour une comparaison des modèles OpenAI dans Azure, veuillez consulter : https://learn.microsoft.com/en-us/azure/ai-services/openai/concepts/models.
Pour savoir comment nous pouvons vous aider à répondre à vos besoins en matière de licences de logiciels, veuillez consulter le site : https://www.schneider.im/fr/logiciels/microsoft/.
Contactez-nous pour obtenir des services d’experts sur vos besoins spécifiques en matière de services en ligne et de logiciels Microsoft et pour demander un devis dès aujourd’hui.