Avec effet au 18 juillet 2024, le modèle le plus rapide d’OpenAI, GPT-4o mini, est disponible sur Microsoft Azure OpenAI Service. Ce modèle offre des améliorations significatives en termes de vitesse, de coût et de capacités multilingues. Il prend en charge le traitement de texte à une vitesse exceptionnelle, et des fonctions d’image, d’audio et de vidéo seront ajoutées ultérieurement. Les clients peuvent l’essayer gratuitement dans Azure OpenAI Studio Playground.
Qu’est-ce que GPT-4o Mini ?
GPT-4o mini est un modèle d’intelligence artificielle très efficace, conçu pour le déploiement rapide et économique d’applications.
Il est nettement plus intelligent que le GPT-3.5 Turbo et atteint 82% au benchmark Measuring Massive Multitask Language Understanding (MMLU), contre 70% pour le GPT-3.5 Turbo.
Il offre également une fenêtre contextuelle de 128K et des capacités multilingues améliorées.
Le réglage fin pour GPT-4o mini est disponible, ce qui permet aux clients de personnaliser le modèle pour des cas d’utilisation et des scénarios spécifiques.
Caractéristiques principales
- Vitesse et coût: plus de 60% moins cher que GPT-3.5 Turbo.
- Performance: atteint 82% en MMLU contre 70% pour le GPT-3.5 Turbo.
- Fenêtre de contexte: étendue à 128K.
La fenêtre de contexte fait référence à la quantité de texte (mesurée en jetons) que le modèle peut prendre en compte lorsqu’il génère des réponses en une seule fois.
Il s’agit essentiellement de la “mémoire” du modèle pendant une seule interaction.
Par exemple, si un modèle a une fenêtre de contexte de 16K tokens, il peut prendre en compte jusqu’à 16.000 tokens de texte provenant de l’historique de la conversation ou des données d’entrée pour générer sa réponse. - Fonctionnalités multilingues: Prise en charge améliorée de plusieurs langues.
- Fonctions de sécurité: Inclut des boucliers d’invite qui empêchent le modèle de générer du contenu malveillant ou inapproprié.
Il dispose également d’une détection de matériel protégé par défaut, qui garantit que le modèle ne transmet pas de contenu confidentiel. - Résidence de données: Disponible dans 27 régions, dont 9 régions en Europe.
Vous trouverez une liste actualisée ici : https://go.microsoft.com/fwlink/?linkid=2274842&clcid=0x409. - Paiement global à la demande: options de paiement flexibles avec une limite de débit élevée de 15 millions de jetons par minute (tokens per minute, TPM).
Licence
GPT-4o mini est disponible dans le cadre du déploiement global à la carte d’Azure AI pour 0,15 $ par million de jetons d’entrée* et 0,60 $ par million de jetons de sortie*.
Ce modèle, comme GPT-3.5 Turbo et GPT-4o, est également disponible via le service Azure AI Batch, qui propose des travaux à haut débit à un prix réduit. Batch fournit des travaux à haut débit dans les 24 heures suivant leur soumission à un prix réduit de 50% en utilisant la capacité en dehors des heures de pointe.
Il s’agit de périodes où la demande de ressources de calcul est plus faible.
En utilisant ces périodes, le service peut offrir un rabais, car les ressources sont moins demandées et donc moins chères à utiliser.
Comparaison des modèles
Caractéristique | GPT-4o Mini | GPT-4o | GPT-3.5 Turbo |
Indice de qualité | 85 | 100 | 59 |
Résultat MMLU | 82% | 88,7% | 70% |
Fenêtre contextuelle | 128K jetons | 128K jetons | 16K jetons |
Vitesse (émission de jetons par seconde) | 108 jetons/sec. | 83 jetons/sec. | 79 jetons/sec. |
Temps de latence (secondes avant le premier token chunk reçu ; moins est mieux) | 0,53 | 0,44 | 0,37 |
Modalités prises en charge | Texte, (à l’avenir : image, audio, vidéo) | Texte, image, audio, vidéo | Texte |
Disponibilité | 27 régions | 27 régions | 27 régions |
Prix standard (tokens d’entrée) | 0,15 $ / 1M jetons* | 5,00 $ / 1M jetons* | 0,50 $ / 1M jetons* |
Prix standard (jeton de sortie) | 0,60 $ / 1M jetons* | 15,00 $ / 1M jetons* | 1,50 $ / 1M jetons* |
*Les prix sont susceptibles d’être modifiés.
Comparaison des performances
Plus d’informations
Vous trouverez l’annonce ici : https://azure.microsoft.com/en-us/blog/openais-fastest-model-gpt-4o-mini-is-now-available-on-azure-ai/.
Pour plus d’informations sur les prix, cliquez ici – les prix d’OpenAI sont les mêmes que ceux d’Azure OpenAI Studio : https://openai.com/api/pricing/.
Vous trouverez une vue d’ensemble des datacentres Microsoft ici : https://datacenters.microsoft.com/globe/explore/.
Vous trouverez une comparaison interactive des modèles ici : https://artificialanalysis.ai/models/gpt-4o-mini/providers.
Pour plus d’informations sur les licences Microsoft, consultez notre page revendeur Microsoft à l’adresse suivante : https://www.schneider.im/fr/logiciels/microsoft/.
Veuillez nous contacter pour obtenir des services d’experts sur vos besoins spécifiques en matière de logiciels Microsoft et de services en ligne et demander un devis dès aujourd’hui.