Historie revizí

Autor SHA1 Zpráva Datum
  Rory Clear 3384fc7294 update tinygrad version před 5 měsíci
  Nel Nibcord 8b71d57da7 Removed inference state entirely před 5 měsíci
  Nel Nibcord 65fdc99ccc Call no longer needs request_id před 5 měsíci
  Nel Nibcord 90518a3bbe Hoisted caching to a wrapper class před 5 měsíci
  Nel Nibcord 8205a5aebc Implemented per-request caching in tinygrad před 5 měsíci
  Nel Nibcord 13572e6a40 Some stability improvements for tinygrad inference před 5 měsíci
  Nel Nibcord 527c7a6e49 Applied new interface to tinygrad and dummy inference engines před 5 měsíci
  Ogden Wells fbec1d2b10 formatted changes před 5 měsíci
  Ogden Wells af01b23a07 added rope_scaling and tie_word_embeddings to llama transformer před 5 měsíci
  Alex Cheema f53056dede more compact operator formatting před 8 měsíci
  Alex Cheema 14f2846a9c yapf set blank_line_before_nested_class_or_def to false před 8 měsíci
  Alex Cheema ea70c9fb76 reformat with yapf format.py před 8 měsíci
  Alex Cheema 803dffd1c4 always call convert_from_huggingface with tinygrad models. this was broken by shard layer filtering which made the check sometimes fail. fixes #144 před 8 měsíci
  Alex Cheema 2be446546f refactor tinygrad, only load necessary layers for each shard fixes #128, enable JIT (much faster), prefill all layers not just the first shard fixes #12, use new ShardDownloader for more robust, parallel downloads před 9 měsíci
  Alex Cheema 55bcad98e3 standardise tinygrad models/tokenizers so it can handle mlx hf před 9 měsíci
  Alex Cheema 4cb36a7f55 increase max line length to 200 před 9 měsíci
  Alex Cheema ce761038ac formatting / linting před 9 měsíci
  Alex Cheema 46d618abed tiny fixes před 9 měsíci
  Alex Cheema dd8d18128c add an opaque inference_state that inference engines can use to pass around small state to other devices před 9 měsíci
  Alex Cheema 5bbde22a23 move everything under exo module před 9 měsíci