Переглянути джерело

TODO for why use_fast=False is giving inconsistent behaviour (no spaces decoding invididual tokens) for Mistral-Large-Instruct-2407-4bit

Alex Cheema 8 місяців тому
батько
коміт
710e5a31e7
1 змінених файлів з 1 додано та 0 видалено
  1. 1 0
      test/test_mistral_tokenizer.py

+ 1 - 0
test/test_mistral_tokenizer.py

@@ -39,6 +39,7 @@ models = [
 import os
 verbose = os.environ.get("VERBOSE", "0").lower() == "1"
 for m in models:
+    # TODO: figure out why use_fast=False is giving inconsistent behaviour (no spaces decoding invididual tokens) for Mistral-Large-Instruct-2407-4bit
     # test_tokenizer(m, AutoProcessor.from_pretrained(m, use_fast=False), verbose)
     test_tokenizer(m, AutoProcessor.from_pretrained(m, use_fast=True), verbose)
     test_tokenizer(m, AutoTokenizer.from_pretrained(m), verbose)