Het model is de chip: waarom AI-inference nooit meer hetzelfde wordt
Wij gaan het zeggen, komt ie: AI-interference wordt nooit meer hetzelfde. Zo. De Canadese AI-startup Taalas haalt namelijk 17.000 tokens per seconde uit een chip die geen GPU is, geen HBM heeft en 200 watt...
Lees meer