Tagged: AI optimization

1 article on ai optimization.

October 17, 2024

Trading Speed for Quality: A Practical Guide to Inference-Time Scaling

Inference-time scaling lets you tune the latency-quality tradeoff at runtime instead of at training time. When to use Best-of-N sampling, beam search, iterative refinement, or one-shot generation, with real examples from clinical AI.

EngineeringRead more →

Tagged: AI optimization

Trading Speed for Quality: A Practical Guide to Inference-Time Scaling

Clint Johnson

Site

Connect

1Put Health