Cassava AI - GPU as a Service

GPU en tant que service

Soyez plus rapide, plus intuitif et plus efficace, en accédant à la puissance du GPU d'une manière adaptée aux besoins de votre entreprise.

Dédié Ressources GPU. Pas de compromis.

Les GPU sont exceptionnels pour leur capacité à exécuter plusieurs tâches simultanément, ce qui leur permet de répondre aux exigences de calcul d'un grand volume de données et de tâches d'analyse. Cette offre s'appuie sur la technologie MIG (Multi-Instance GPU) de NVIDIA, un niveau matériel capable de diviser en toute sécurité un GPU NVIDIA H200 physique en un maximum de sept instances indépendantes et isolées. Contrairement à la virtualisation basée sur un logiciel, chaque instance MIG dispose de ses propres cœurs de calcul dédiés, d'une mémoire à large bande passante et d'une mémoire cache. Cela garantit la qualité de service (QoS), assurant que la performance de la charge de travail d'un client est prévisible et n'est pas affectée par d'autres locataires sur le même matériel physique.

L'ensemble de l'environnement est orchestré par la suite logicielle NVIDIA AI Enterprise, qui fournit les composants essentiels pour une expérience utilisateur transparente.

Sur demande

On-Demand est le modèle le plus flexible pour accéder à la puissance du GPU H200. Les clients ne paient que pour la quantité exacte de temps de calcul qu'ils utilisent, facturée à l'heure, sans coûts initiaux ni contrats à long terme.

Ce plan est le mieux adapté pour :

Les nouveaux clients qui veulent essayer la plateforme sans s'engager dans un plan à long terme.
Les entreprises dont la charge de travail est imprévisible et qui ont besoin d'un plan capable de s'adapter aux exigences de leur entreprise.
Les développeurs et les chercheurs qui effectuent des tests à court terme et prototypent de nouveaux modèles.

Réservé

Le modèle réservé est un engagement stratégique qui implique de s'engager sur une quantité spécifique de capacité de GPU H200 pour une durée de 1 à 5 ans, et de bénéficier d'une remise substantielle sur le taux horaire. Ils ont ainsi la garantie que la capacité qu'ils ont payée sera toujours disponible pour leurs charges de travail.

Ce plan est le mieux adapté pour :

Les entreprises dont les charges de travail de production sont stables et qui ont besoin d'applications fonctionnant en permanence.
Les organisations soucieuses de leur budget qui veulent des coûts hautement prévisibles et gérables.
Les entreprises disposant d'applications critiques et de services d'IA qui ne peuvent se passer de puissance informatique.

Spot

Profitez de notre capacité GPU inutilisée. L'aspect le plus critique des instances Spot est qu'elles peuvent être interrompues ou “préemptées” avec un préavis très court. Si nous avons besoin de cette capacité pour servir un client à la demande ou réservé, l'instance Spot sera interrompue. C'est le moyen le plus rentable d'accéder aux puissantes ressources GPU H200.

Ce plan est le mieux adapté pour :

Commencer

Explorez nos solutions d'IA pour réaliser le plein potentiel de la transformation numérique.