Héberger des LLMs (LLaMA, Mistral, style GPT)
Exécutez des modèles de langage open-source comme LLaMA 3, Mistral 7B, Falcon et Mixtral sur des instances GPU dédiées. Servez des milliers de tokens par seconde avec un contrôle total du modèle.
Começar com Héberger→