3 tuần trước cách đây · c2f98a4cd2
--- a/backend/open_webui/utils/middleware.py
+++ b/backend/open_webui/utils/middleware.py
@@ -2031,6 +2031,20 @@ async def process_chat_response(
 
				                                     )
			
 
				                                 else:
			
 
				                                     choices = data.get("choices", [])
			
 
				+
			
 
				+                                    # 17421
			
 
				+                                    usage = data.get("usage", {})
			
 
				+                                    usage.update(data.get("timings", {}))  # llama.cpp
			
 
				+                                    if usage:
			
 
				+                                        await event_emitter(
			
 
				+                                            {
			
 
				+                                                "type": "chat:completion",
			
 
				+                                                "data": {
			
 
				+                                                    "usage": usage,
			
 
				+                                                },
			
 
				+                                            }
			
 
				+                                        )
			
 
				+
			
 
				                                     if not choices:
			
 
				                                         error = data.get("error", {})
			
 
				                                         if error:
			
@@ -2042,20 +2056,6 @@ async def process_chat_response(
 
				                                                     },
			
 
				                                                 }
			
 
				                                             )
			
 
				-                                        usage = data.get("usage", {})
			
 
				-                                        usage.update(
			
 
				-                                            data.get("timings", {})
			
 
				-                                        )  # llama.cpp
			
 
				-
			
 
				-                                        if usage:
			
 
				-                                            await event_emitter(
			
 
				-                                                {
			
 
				-                                                    "type": "chat:completion",
			
 
				-                                                    "data": {
			
 
				-                                                        "usage": usage,
			
 
				-                                                    },
			
 
				-                                                }
			
 
				-                                            )
			
 
				                                         continue
			
 
				 
			
 
				                                     delta = choices[0].get("delta", {})