8 months ago · 3908b97a2b
--- a/exo/main.py
+++ b/exo/main.py
@@ -144,6 +144,43 @@ async def shutdown(signal, loop):
 
				   await server.stop()
			
 
				   loop.stop()
			
 
				 
			
 
				+async def select_best_inference_engine(node: StandardNode):
			
 
				+  supported_engines = set(node.get_supported_inference_engines())
			
 
				+  await node.broadcast_supported_engines(supported_engines)
			
 
				+  num_peers = len(node.peers)
			
 
				+  all_peers_responded = asyncio.Event()
			
 
				+  def check_all_responses():
			
 
				+      if len(node.received_opaque_statuses) >= num_peers:
			
 
				+          all_peers_responded.set()
			
 
				+  node.on_opaque_status.register("engine_selection").on_next(lambda *args: check_all_responses())
			
 
				+  try:
			
 
				+      await asyncio.wait_for(all_peers_responded.wait(), timeout=10.0)
			
 
				+  except asyncio.TimeoutError:
			
 
				+      print("Timed out waiting for peer nodes to respond.")
			
 
				+  node.on_opaque_status.unregister("engine_selection")
			
 
				+  all_supported_engines = [supported_engines]
			
 
				+  for peer_id, status in node.received_opaque_statuses:
			
 
				+      try:
			
 
				+          status_data = json.loads(status)
			
 
				+          if status_data.get("type") == "supported_inference_engines":
			
 
				+              all_supported_engines.append(set(status_data.get("engines", [])))
			
 
				+      except json.JSONDecodeError:
			
 
				+          continue
			
 
				+  if any("tinygrad" in engines and len(engines) == 1 for engines in all_supported_engines):
			
 
				+      return "tinygrad"
			
 
				+  common_engines_across_peers = set.intersection(*all_supported_engines)
			
 
				+  with open('check_engines.txt', 'w') as f:
			
 
				+    f.write(common_engines_across_peers)
			
 
				+    f.close()
			
 
				+  print(f'common_engines_across_peers:{common_engines_across_peers}')
			
 
				+  if "mlx" in common_engines_across_peers:
			
 
				+      print('mlx')
			
 
				+      return "mlx"
			
 
				+  elif "tinygrad" in common_engines_across_peers:
			
 
				+      return "tinygrad"
			
 
				+  else:
			
 
				+      raise ValueError("No compatible inference engine found across all nodes")
			
 
				+
			
 
				 
			
 
				 async def run_model_cli(node: Node, inference_engine: InferenceEngine, model_name: str, prompt: str):
			
 
				   shard = model_base_shards.get(model_name, {}).get(inference_engine.__class__.__name__)
			
--- a/exo/orchestration/standard_node.py
+++ b/exo/orchestration/standard_node.py
@@ -76,6 +76,22 @@ class StandardNode(Node):
 
				       if DEBUG >= 1: print(f"Error updating visualization: {e}")
			
 
				       if DEBUG >= 1: traceback.print_exc()
			
 
				 
			
 
				+  def get_supported_inference_engines(self):
			
 
				+    supported_engines = []
			
 
				+    if self.inferenceEngine == 'mlx':
			
 
				+      supported_engines.extend('mlx', 'tinygrad')
			
 
				+    else:
			
 
				+      supported_engines.append('tinygrad')
			
 
				+    return supported_engines
			
 
				+
			
 
				+  async def broadcast_supported_engines(self):
			
 
				+    supported_engines = self.get_supported_inference_engines()
			
 
				+    await self.broadcast_opaque_status("", json.dumps({
			
 
				+      "type": "supported_inference_engines",
			
 
				+      "node_id": self.id, 
			
 
				+      "engines": supported_engines
			
 
				+    }))
			
 
				+
			
 
				   async def process_prompt(self, base_shard: Shard, prompt: str, image_str: Optional[str] = None, request_id: Optional[str] = None, inference_state: Optional[str] = None) -> Optional[np.ndarray]:
			
 
				     shard = self.get_current_shard(base_shard)
			
 
				     asyncio.create_task(