
Ce nouveau portail permet aux développeurs d’accéder directement aux LLM compressés, avec une visibilité complète sur leur utilisation et la gestion des tokens.
Multiverse Computing, spécialiste des modèles d’intelligence artificielle compressés, annonce le lancement du CompactifAI API Public Portal, une nouvelle plateforme en libre-service permettant aux développeurs et aux entreprises d’accéder directement aux modèles d’IA compressés de l’entreprise et de les gérer via une API.
Ce portail offre une authentification sécurisée, des fonctionnalités de gestion des tokens API ainsi qu’un suivi en temps réel de l’utilisation. Les équipes peuvent ainsi intégrer plus facilement de grands modèles de langage compressés dans leurs environnements de production, tout en bénéficiant d’un meilleur contrôle et de transparence.
Jusqu’à présent, les modèles d’IA de Multiverse Computing étaient principalement accessibles via la Marketplace d’AWS. Avec ce nouveau portail, les développeurs disposent désormais d’un accès direct aux modèles compressés de l’entreprise, ce qui simplifie leur intégration tout en offrant une visibilité complète sur leur utilisation et leur montée en charge.
La technologie CompactifAI permet de compresser les grands modèles de langage afin de réduire significativement les besoins en calcul, tout en conservant leurs performances. Les organisations peuvent ainsi déployer des systèmes d’IA avancés avec des coûts et des besoins d’infrastructure nettement réduits.
Générer et gérer des tokens API pour des intégrations sécurisées ;
Suivre en temps réel les métriques d’utilisation et la consommation des modèles ;
Analyser l’activité et les besoins de montée en charge au niveau des modèles ;
Gérer les comptes et les droits d’accès depuis une interface centralisée.
La plateforme a été conçue pour accompagner les équipes techniques déployant des modèles d’IA compressés aussi bien dans des environnements cloud que sur des infrastructures on-premise.
« Le principal frein au déploiement de modèles d’IA avancés réside souvent dans la complexité opérationnelle. Avec le portail API CompactifAI, les développeurs disposent d’un accès direct à des modèles compressés, ainsi que de la transparence et du contrôle nécessaires pour les exploiter en production. »Enrique Lizaso, cofondateur et CEO de Multiverse Computing
Le portail intègre également des mécanismes d’authentification de niveau entreprise, dont l’authentification unique (SSO), permettant aux organisations de gérer l’accès à leur infrastructure d’IA de manière centralisée et sécurisée.
En facilitant l’accès direct à ses modèles via API, Multiverse Computing entend accélérer leur déploiement dans de nombreux secteurs, notamment la finance, l’énergie et la défense. Le CompactifAI API Public Portal est disponible dès aujourd’hui.