Преглед изворни кода

Merge pull request #13085 from ayan4m1/fix/tika-image-ocr

fix: pass extractInlineImages header to Tika if PDF_EXTRACT_IMAGES is true
Tim Jaeryang Baek пре 5 месеци
родитељ
комит
7d184c3a14
1 измењених фајлова са 3 додато и 0 уклоњено
  1. 3 0
      backend/open_webui/retrieval/loaders/main.py

+ 3 - 0
backend/open_webui/retrieval/loaders/main.py

@@ -99,6 +99,9 @@ class TikaLoader:
         else:
             headers = {}
 
+        if self.kwargs.get("PDF_EXTRACT_IMAGES") == True:
+            headers['X-Tika-PDFextractInlineImages'] = 'true'
+
         endpoint = self.url
         if not endpoint.endswith("/"):
             endpoint += "/"