7 miesięcy temu · b1b08e68fc
--- a/exo/inference/mlx/sharded_inference_engine.py
+++ b/exo/inference/mlx/sharded_inference_engine.py
@@ -28,6 +28,7 @@ def sample_logits(
 
				       token = top_p_sampling(logits, top_p, temp)
			
 
				     else:
			
 
				       token = mx.random.categorical(logits*(1/temp))
			
 
				+
			
 
				   return token
			
 
				 
			
 
				 class MLXDynamicShardInferenceEngine(InferenceEngine):