Cassava AI - GPU as a Service

GPU como servicio

Sea más rápido, más intuitivo y más eficiente, accediendo a la potencia de la GPU de una forma que se adapte a las necesidades de su negocio.

Dedicado Recursos de la GPU. Sin compromisos.

Las GPU son excepcionales por su capacidad para ejecutar múltiples tareas simultáneamente, lo que les permite manejar las demandas computacionales de un alto volumen de procesamiento de datos y tareas de análisis. Esta oferta aprovecha la tecnología Multi-Instance GPU (MIG) de NVIDIA, un nivel de hardware capaz de dividir de forma segura una GPU NVIDIA H200 física en hasta siete instancias independientes y aisladas. A diferencia de la virtualización basada en software, cada instancia MIG tiene sus propios núcleos de cálculo dedicados, memoria de gran ancho de banda y caché. Esto garantiza la calidad del servicio (QoS), asegurando que el rendimiento de la carga de trabajo de un cliente sea predecible y no se vea afectado por otros inquilinos en el mismo hardware físico.

Todo el entorno está orquestado por el paquete de software NVIDIA AI Enterprise, que proporciona los componentes esenciales para una experiencia de usuario fluida.

A la carta

On-Demand es el modelo más flexible para acceder a la potencia de la GPU H200. Los clientes sólo pagan por la cantidad exacta de tiempo de cálculo que utilizan, facturado por horas, sin costes iniciales ni contratos a largo plazo.

Este plan es el más adecuado para:

Nuevos clientes que quieren probar la plataforma sin comprometerse a un plan a largo plazo.
Empresas con cargas de trabajo impredecibles que necesitan un plan que pueda adaptarse a las exigencias de su empresa.
Desarrolladores e investigadores que realizan pruebas a corto plazo y crean prototipos de nuevos modelos.

Reservado

El modelo Reservado es un compromiso estratégico que implica comprometerse con una cantidad específica de capacidad de GPU H200 por plazos de 1 a 5 años, reciben un descuento sustancial en la tarifa por hora. Esto les garantiza que la capacidad por la que han pagado estará siempre disponible para sus cargas de trabajo.

Este plan es el más adecuado para:

Empresas con cargas de trabajo de producción estables que requieren que las aplicaciones funcionen las 24 horas del día.
Organizaciones preocupadas por el presupuesto que desean costes muy predecibles y gestionables.
Empresas con aplicaciones de misión crítica y servicios de IA a las que no les puede faltar potencia informática.

Spot

Aproveche nuestra capacidad de GPU no utilizada. El aspecto más crítico de las instancias de subasta es que pueden interrumpirse o “adelantarse” con muy poca antelación. Si necesitamos esa capacidad para atender a un cliente On-Demand o Reserved, la instancia Spot se dará por terminada. Es la forma más rentable de acceder a los potentes recursos de la GPU H200.

Este plan es el más adecuado para:

Empezar

Explore nuestras soluciones de IA para aprovechar todo el potencial de la transformación digital.