Guía de producto de alojamiento de alquiler Nvidia DGX Spark


Equipado con GPU y CPU de arquitectura NVIDIA Grace Blackwell
NVIDIA Grace Blackwell architecture with integrated GPU and CPU
Procesador ARM de 20 núcleos
- 20-core Arm processor with high-performance cores
Equipado con 128 GB de memoria
- 128 GB unified system memory
- Advanced connectivity including Wi-Fi 7, 10 GbE, and ConnectX-7
- Support for AI models up to 200 billion parameters (or 405B for dual-Spark configuration) GPU
- NVIDIA Blackwell Architecture with 5th Generation Tensor Cores, 4th Generation RT Cores CPU
- 20-core Arm processor (10 Cortex-X925 + 10 Cortex-A725) Memory
- 128 GB LPDDR5x unified system memory, 256-bit interface, 4266 MHz, 273 GB/s bandwidth Video Processing
- 1x NVENC, 1x NVDEC
https://build.nvidia.com/spark : Posible estudiar con material educativo oficial de NVIDIA.

NVIDIA DGX Spark es una plataforma de computación especializada en IA de ultra alto rendimiento para empresas.
Desde LLM, IA generativa, modelos de visión hasta análisis de datos a gran escala
Proporciona potencia de GPU de nivel suficiente para el funcionamiento de servicios reales, más allá del uso para investigación.
✔ Basado en la última arquitectura de GPU NVIDIA
✔ Equipado de serie con NVLink de ultra alta velocidad y stack optimizado para IA
✔ Estabilidad y escalabilidad de nivel empresarial
✔ Optimizado para entornos de entrenamiento de LLM grandes / multi GPU
No es un simple servidor GPU.
Es una plataforma completa que permite comenzar inmediatamente con el negocio de IA.
Startups de IA / Institutos de investigación / Universidades / Ciencia
Llama / Mixtral / Qwen / Kimi / Stable Diffusion
Fine-tuning, entrenamiento LoRA, construcción de infraestructura RAG
Entorno on-premise para despliegue interno de LLM en la empresa
Entrenamiento de conjuntos de datos a gran escala y serving de modelos
Multi-tenancy posible basado en virtualización de GPU
Óptimo para operación de plataformas SaaS de IA
Utilizable como servidor de inferencia para modelos grandes
Optimizado para negocios de alquiler de GPU
El activo principal de la era de la IA son las GPUs.
Tráfico básico incluido: 10TB mensuales
En caso de exceso, 40 won por cada 1GB
La activación del servicio toma aproximadamente 1 día después del pago.