Microsoft Azure AI : GPT-4.5, Phi-4, Stability AI, o3-mini, GPT-4o-Audio et Realtime

A compter du 20 mars 2025, divers nouveaux modèles d’IA ont été introduits dans Microsoft Azure AI Foundry. Il s’agit notamment des modèles OpenAI GPT-4.5, Microsoft Phi-4-multimodal, Microsoft Phi-4-mini, des derniers modèles d’imagerie générative de Stability AI et OpenAI o3-mini. Cohere ReRank v3.5, OpenAI GPT-4o-Audio-Preview et GPT-4o-Realtime-Preview ont également été ajoutés. Explorons ces nouveaux LLM en détail et découvrons s’ils répondent à vos besoins.

 

Les modèles en détail

OpenAI GPT-4.5

OpenAI GPT-4.5 (preview) est le modèle polyvalent le plus récent et le plus avancé développé par OpenAI. Il s’appuie sur le succès des modèles précédents et offre des capacités accrues en matière de codage, d’écriture et de résolution de problèmes. GPT-4.5 est conçu pour offrir une expérience d’interaction plus naturelle, avec une base de connaissances plus large et une intelligence émotionnelle (EQ) améliorée.

  • Interaction naturelle: Offre une expérience d’interaction plus naturelle avec une base de connaissances plus large.
  • Précision et hallucinations: Taux d’hallucinations plus faible (37,1 % contre 61,8 %) et précision plus élevée (62,5 % contre 38,2 %) par rapport au GPT-4.
  • Un alignement humain plus fort: Les techniques d’alignement améliorées permettent de mieux suivre les instructions, de comprendre les nuances et de participer à des conversations naturelles.

Il est censé être le dernier modèle non raisonneur de l’OpenAI. OpenAI se concentrera sur les modèles de raisonnement de la série o avec des modèles tels que o3-mini.

OpenAI o3-mini

OpenAI o3-mini est un modèle de raisonnement qui offre des économies significatives par rapport aux modèles o précédents. Il introduit de nouvelles fonctionnalités telles que le contrôle de l’effort de raisonnement et les outils, offrant une réactivité comparable ou supérieure. Avec des performances plus rapides et une latence plus faible, o3-mini est conçu pour gérer des charges de travail de raisonnement complexes tout en maintenant l’efficacité.

  • Contrôle de l’effort de raisonnement: Permet aux utilisateurs d’ajuster la charge cognitive du modèle avec des niveaux de raisonnement faibles, moyens et élevés.
  • Sorties structurées: Prend en charge les contraintes du schéma JSON pour des sorties bien définies et structurées.
  • Prise en charge des fonctions et des outils: S’intègre aux fonctions et aux outils externes pour une automatisation alimentée par l’IA.

Microsoft Phi-4-multimodal

Microsoft Phi-4-multimodal est un modèle d’IA qui unifie le texte, la parole et la vision pour des interactions tenant compte du contexte. Ce modèle est conçu pour améliorer l’expérience des utilisateurs en permettant des interactions plus naturelles et intuitives. Par exemple, les kiosques de vente au détail peuvent désormais diagnostiquer les problèmes liés aux produits à l’aide d’une caméra et d’entrées vocales, éliminant ainsi le besoin de descriptions manuelles complexes.

  • Interactions tenant compte du contexte: Unifie le texte, la parole et la vision pour des expériences utilisateur plus intuitives.
  • Intégration des kiosques de vente au détail: Permet de diagnostiquer les problèmes liés aux produits à l’aide d’une caméra et d’entrées vocales.

Microsoft Phi-4-mini

Microsoft Phi-4-mini est un modèle d’IA compact mais puissant, avec seulement 3,8 milliards de paramètres et une fenêtre contextuelle de 128K-tokens. Malgré sa petite taille, il surpasse les modèles plus grands dans les tâches de codage et de mathématiques, tout en augmentant la vitesse d’inférence de 30 % par rapport aux modèles précédents.

  • Performance compacte: Des performances impressionnantes pour seulement 3,8 milliards de paramètres.
  • Efficacité: Surpasse les grands modèles dans les tâches de codage et de mathématiques avec une augmentation de 30 % de la vitesse d’inférence.

Modèles d’imagerie générative de Stability AI

Stability AI continue de faire progresser l’imagerie générative avec des modèles qui accélèrent les flux de travail créatifs. Les derniers modèles sont les suivants :

  • Stable Diffusion 3.5 Large: Génère des actifs marketing haute-fidélité plus rapidement que les versions précédentes, en maintenant la cohérence de la marque à travers différents styles visuels.
  • Stable Image Ultra: permet d’obtenir un photoréalisme pour l’imagerie des produits, réduisant ainsi les coûts de prise de vue grâce à un rendu précis des matériaux et à la fidélité des couleurs.
  • Stable Image Core: Une version améliorée de SDXL (Stable Diffusion XL), qui permet d’obtenir des résultats de haute qualité avec une rapidité et une efficacité exceptionnelles.
Réalisé par les modèles de Stability AI

 

Passage à des modèles de raisonnement

Le paysage des grands modèles de langage (Large Language Models, LLM) évolue, avec une évolution significative vers les modèles de raisonnement. L’introduction par DeepSeek de modèles de raisonnement économiques a accéléré le passage aux modèles de raisonnement en démontrant que les tâches cognitives avancées peuvent être traitées avec moins de ressources informatiques, ce qui rend l’IA sophistiquée plus accessible et évolutive pour les entreprises. Contrairement aux modèles d’IA traditionnels tels que GPT-4.5, qui se concentrent principalement sur la reconnaissance des formes et le traitement des données, les modèles de raisonnement tels que OpenAI o3-mini sont conçus pour traiter des tâches cognitives complexes. Ils offrent une compréhension plus profonde et des réponses plus précises, ce qui les rend idéaux pour les applications qui nécessitent une pensée logique, la résolution de problèmes et la prise de décision.

Ils excellent dans divers scénarios, notamment le codage, le raisonnement mathématique, la recherche scientifique, l’analyse commerciale et l’assistance à la clientèle. Ils sont dotés de capacités avancées telles que le contrôle de l’effort de raisonnement, les sorties structurées et l’intégration avec des outils externes. Ils sont donc très efficaces pour fournir des interactions précises et adaptées au contexte.

Le passage aux modèles de raisonnement a également des implications importantes en termes de puissance de calcul et de coût. Si DeepSeek a démontré que les modèles de raisonnement peuvent être rentables, ces modèles nécessitent généralement plus de ressources informatiques que les grands modèles de langage (LLM) traditionnels. Cette demande accrue de puissance de calcul se traduit souvent par des coûts opérationnels plus élevés. Cependant, les capacités avancées et les performances améliorées des modèles de raisonnement justifient l’investissement, car ils offrent une plus grande précision, une plus grande fiabilité et une plus grande efficacité dans le traitement des tâches complexes. Nous nous attendons à ce que le coût de 1 million de jetons diminue dans les futurs modèles de raisonnement, et des entreprises comme OpenAI proposent des alternatives moins chères (par exemple o3-mini) pour rendre les modèles de raisonnement plus abordables.

 

Cas d’utilisation de ces différents mécanismes d’apprentissage tout au long de la vie

  • Assistance au codage: GPT-4.5 et Phi-4-mini peuvent fournir des conseils étape par étape et automatiser les tâches répétitives, ce qui permet de gagner du temps et de réduire les erreurs.
  • Création de contenu: Utilisez le TPG-4.5 pour rédiger des courriels, des messages et de la documentation clairs et efficaces.
  • Tâches complexes: Demandez à o3-mini d’utiliser ses capacités de raisonnement pour des tâches complexes telles que la génération de formules mathématiques compliquées ou l’exécution de flux de travail en plusieurs étapes.
  • Intégration des kiosques de vente au détail: Phi-4-multimodal permet de diagnostiquer les problèmes liés aux produits à l’aide d’une caméra et d’entrées vocales, ce qui améliore le service à la clientèle.
  • Actifs marketing: Stable Diffusion 3.5 Large génère des actifs marketing de haute fidélité, en maintenant la cohérence de la marque.
  • Imagerie du produit: Stable Image Ultra permet d’obtenir un photoréalisme lors de la création d’images, ce qui réduit les coûts de prise de vue.

 

Comment puis-je découvrir ces nouveaux modules d’apprentissage tout au long de la vie ?

Pour tirer parti des nouvelles capacités des modèles d’IA dans Azure, vous pouvez :

  • Explorez l’Azure OpenAI Foundry: Découvrez les solutions d’IA disponibles dans Azure AI Foundry https://ai.azure.com/explore/models.
  • Vérifiez le budget et les licences: Comparez les différentes capacités et les prix des modèles disponibles. N’hésitez pas à contacter SCHNEIDER IT MANAGEMENT pour obtenir de l’aide concernant les licences de votre environnement Microsoft Azure.

 

Plus d’informations

Azure OpenAI Service : https://azure.microsoft.com/en-us/products/ai-services/openai-service/.

Tableau de bord Azure AI Foundry : https://ai.azure.com/.

Annonce O3-mini : https://azure.microsoft.com/en-us/blog/announcing-the-availability-of-the-o3-mini-reasoning-model-in-microsoft-azure-openai-service/.

Autres modèles mentionnés : https://azure.microsoft.com/en-us/blog/announcing-new-models-customization-tools-and-enterprise-agent-upgrades-in-azure-ai-foundry/.

Contactez nous pour obtenir des tarifs avantageux sur Azure en transférant votre consommation Azure à SCHNEIDER IT MANAGEMENT.

Partager l'article