Historial de Commits

Autor SHA1 Mensaje Fecha
  Nel Nibcord 90518a3bbe Hoisted caching to a wrapper class hace 10 meses
  Nel Nibcord bf33ffde87 This doesn't need to be a tuple really hace 10 meses
  Nel Nibcord 10e9f44a10 one-line output buffering hace 10 meses
  Nel Nibcord 52ef6ee4a3 Made temperature and top_p available to the inference engine sample interfaces hace 10 meses
  Nel Nibcord 8205a5aebc Implemented per-request caching in tinygrad hace 10 meses
  Nel Nibcord 13572e6a40 Some stability improvements for tinygrad inference hace 10 meses
  Nel Nibcord aefc0d7c51 I think this is more faithful to how it was originally done hace 10 meses
  Nel Nibcord c06b5f3b56 Corrected type annotations hace 10 meses
  Nel Nibcord 9b66758b59 Make sure they're np arrays hace 10 meses
  Nel Nibcord b9d0fb6825 Since infer_prompt is a thin wrapper that works the same for all inference engines, we can de-abstract it hace 10 meses
  Nel Nibcord 527c7a6e49 Applied new interface to tinygrad and dummy inference engines hace 10 meses
  Nel Nibcord 52b91de817 Changed model classname due to the sharding being done elsewhere hace 10 meses
  Nel Nibcord 34019e4608 Forgot an abstractmethod hace 10 meses
  Nel Nibcord 82cce4408e Some initial inference engine refactors for enabling training hace 10 meses
  Alex Cheema 4713bc5acd Merge pull request #431 from exo-explore/qwen32b hace 10 meses
  Alex Cheema e9ba815c21 add qwen2.5 coder 3b,14b,32b hace 10 meses
  Alex Cheema a0b6adad85 Merge pull request #430 from austinbv/patch-1 hace 10 meses
  Austin 5435671cd9 Add 32b Qwen 2.5 hace 10 meses
  Alex Cheema 526f8a7ad5 Merge pull request #429 from exo-explore/readme_hf_home hace 10 meses
  Alex Cheema 167e756b31 add documentation of HF_HOME model storage location in README. fixes #427 hace 10 meses
  Alex Cheema b41b7d778a Merge pull request #426 from exo-explore/tinygrad_ci_test hace 10 meses
  Alex Cheema 9e4366f36b tinygrad ci hace 10 meses
  Alex Cheema 6cd78b94d4 run tinygrad test with CLANG=1 hace 10 meses
  Alex Cheema 49c4394dfa enable tinygrad test hace 10 meses
  Alex Cheema 77d78935b7 remove redundant expected_content hace 10 meses
  Alex Cheema 8cc3f51e79 test for tinygrad e2e hace 10 meses
  Alex Cheema 858421a3a7 Merge pull request #418 from BatSmacker84/llama-3.2-support hace 10 meses
  Alex Cheema 832a860b34 Merge pull request #424 from exo-explore/llama405b-8bit hace 10 meses
  Alex Cheema 472359147d ignore 8bit llama 405b from tokenizers test hace 10 meses
  Alex Cheema 49833e1fde Merge pull request #423 from exo-explore/llama405b-8bit hace 10 meses