Microsoft Azure
Mise à jour : juillet 26, 2024

Microsoft Azure AI : GPT-4o Mini disponible

Avec effet au 18 juillet 2024, le modèle le plus rapide d’OpenAI, GPT-4o mini, est disponible sur Microsoft Azure OpenAI Service. Ce modèle offre des améliorations significatives en termes de vitesse, de coût et de capacités multilingues. Il prend en charge le traitement de texte à une vitesse exceptionnelle, et des fonctions d’image, d’audio et de vidéo seront ajoutées ultérieurement. Les clients peuvent l’essayer gratuitement dans Azure OpenAI Studio Playground.

Qu’est-ce que GPT-4o Mini ?

GPT-4o mini est un modèle d’intelligence artificielle très efficace, conçu pour le déploiement rapide et économique d’applications.
Il est nettement plus intelligent que le GPT-3.5 Turbo et atteint 82% au benchmark Measuring Massive Multitask Language Understanding (MMLU), contre 70% pour le GPT-3.5 Turbo.
Il offre également une fenêtre contextuelle de 128K et des capacités multilingues améliorées.
Le réglage fin pour GPT-4o mini est disponible, ce qui permet aux clients de personnaliser le modèle pour des cas d’utilisation et des scénarios spécifiques.

Caractéristiques principales

Vitesse et coût: plus de 60% moins cher que GPT-3.5 Turbo.
Performance: atteint 82% en MMLU contre 70% pour le GPT-3.5 Turbo.
Fenêtre de contexte: étendue à 128K.
La fenêtre de contexte fait référence à la quantité de texte (mesurée en jetons) que le modèle peut prendre en compte lorsqu’il génère des réponses en une seule fois.
Il s’agit essentiellement de la « mémoire » du modèle pendant une seule interaction.
Par exemple, si un modèle a une fenêtre de contexte de 16K tokens, il peut prendre en compte jusqu’à 16.000 tokens de texte provenant de l’historique de la conversation ou des données d’entrée pour générer sa réponse.
Fonctionnalités multilingues: Prise en charge améliorée de plusieurs langues.
Fonctions de sécurité: Inclut des boucliers d’invite qui empêchent le modèle de générer du contenu malveillant ou inapproprié.
Il dispose également d’une détection de matériel protégé par défaut, qui garantit que le modèle ne transmet pas de contenu confidentiel.
Résidence de données: Disponible dans 27 régions, dont 9 régions en Europe.
Vous trouverez une liste actualisée ici : https://go.microsoft.com/fwlink/?linkid=2274842&clcid=0x409.
Paiement global à la demande: options de paiement flexibles avec une limite de débit élevée de 15 millions de jetons par minute (tokens per minute, TPM).

Licence

GPT-4o mini est disponible dans le cadre du déploiement global à la carte d’Azure AI pour 0,15 $ par million de jetons d’entrée* et 0,60 $ par million de jetons de sortie*.
Ce modèle, comme GPT-3.5 Turbo et GPT-4o, est également disponible via le service Azure AI Batch, qui propose des travaux à haut débit à un prix réduit. Batch fournit des travaux à haut débit dans les 24 heures suivant leur soumission à un prix réduit de 50% en utilisant la capacité en dehors des heures de pointe.
Il s’agit de périodes où la demande de ressources de calcul est plus faible.
En utilisant ces périodes, le service peut offrir un rabais, car les ressources sont moins demandées et donc moins chères à utiliser.

Comparaison des modèles

Caractéristique	GPT-4o Mini	GPT-4o	GPT-3.5 Turbo
Indice de qualité	85	100	59
Résultat MMLU	82%	88,7%	70%
Fenêtre contextuelle	128K jetons	128K jetons	16K jetons
Vitesse (émission de jetons par seconde)	108 jetons/sec.	83 jetons/sec.	79 jetons/sec.
Temps de latence (secondes avant le premier token chunk reçu ; moins est mieux)	0,53	0,44	0,37
Modalités prises en charge	Texte, (à l’avenir : image, audio, vidéo)	Texte, image, audio, vidéo	Texte
Disponibilité	27 régions	27 régions	27 régions
Prix standard (tokens d’entrée)	0,15 $ / 1M jetons*	5,00 $ / 1M jetons*	0,50 $ / 1M jetons*
Prix standard (jeton de sortie)	0,60 $ / 1M jetons*	15,00 $ / 1M jetons*	1,50 $ / 1M jetons*

*Les prix sont susceptibles d’être modifiés.

Comparaison des performances

Plus d’informations

Vous trouverez l’annonce ici : https://azure.microsoft.com/en-us/blog/openais-fastest-model-gpt-4o-mini-is-now-available-on-azure-ai/.

Pour plus d’informations sur les prix, cliquez ici – les prix d’OpenAI sont les mêmes que ceux d’Azure OpenAI Studio : https://openai.com/api/pricing/.

Vous trouverez une vue d’ensemble des datacentres Microsoft ici : https://datacenters.microsoft.com/globe/explore/.

Vous trouverez une comparaison interactive des modèles ici : https://artificialanalysis.ai/models/gpt-4o-mini/providers.

Pour plus d’informations sur les licences Microsoft, consultez notre page revendeur Microsoft à l’adresse suivante : https://www.schneider.im/fr/logiciels/microsoft/.

Veuillez nous contacter pour obtenir des services d’experts sur vos besoins spécifiques en matière de logiciels Microsoft et de services en ligne et demander un devis dès aujourd’hui.

Des questions sur l'octroi de licences ?
Nos experts ont des réponses.

Partager l'article

Salle de presse

Dernières infos sur
l’octroi de licences.

Microsoft Azure AI : GPT-4o Mini disponible

Qu’est-ce que GPT-4o Mini ?

Caractéristiques principales

Licence

Comparaison des modèles

Comparaison des performances

Plus d’informations

Microsoft Azure Communication Services: Gestion d’un volume important de courriels

Microsoft Azure : utilisez gratuitement SQL Managed Instance et Database

Microsoft Foundry Local : exécuter localement des modèles d’IA

News

Promotion Microsoft 365 E3/E5 dans CSP : économisez 15%

Promotion Microsoft 365 Copilot: Économisez 15 %

Microsoft Azure Communication Services: Gestion d’un volume important de courriels