Cerebras Systems lansează serviciul său de inferență AI

Recent, Cerebras Systems a anunțat lansarea serviciului său de inferență AI, care promite să fie cea mai rapidă soluție de inferență AI din lume. Acest nou serviciu, numit Cerebras Inference, oferă o viteză de procesare de 1.800 de tokeni pe secundă pentru modelul Llama3.1 8B și 450 de tokeni pe secundă pentru Llama3.1 70B, ceea […]

Continue Reading