LocalAI History

Acceleration	Hardware	Notes
NVIDIA CUDA 12/13	Nvidia GPUs	Full CUDA support
AMD ROCm	AMD Graphics	llama.cpp, vLLM, transformers
Intel oneAPI	Intel Arc, iGPUs	llama.cpp, vLLM, transformers
Apple Metal	M1/M2/M3+	llama.cpp, MLX, diffusers
Vulkan	Cross-platform	llama.cpp, whisper, stablediffusion
NVIDIA Jetson	AGX Orin, DGX Spark	ARM64 embedded AI
CPU	AVX/AVX2/AVX512	All backends with quantization

¶ LocalAI History