Безопасность
· 1 мин
Groq: инференс-чип в 10 раз быстрее GPU
Groq представил LPU — чип для инференса, который обрабатывает запросы к LLM в 10 раз быстрее GPU Nvidia. 800 токенов/сек вместо 80.
Groq представил LPU — чип для инференса, который обрабатывает запросы к LLM в 10 раз быстрее GPU Nvidia. 800 токенов/сек вместо 80.
Cerebras Systems — создатель крупнейшего в мире AI-чипа WSE-3 — подала документы на IPO. Единственный стартап, способный конкурировать с Nvidia по обучению моделей.