Историја ревизија

Аутор SHA1 Порука Датум
  Alex Cheema faa1319470 disable chatgpt api integration test, github changed something in their mac runners? perhaps time to switch over to circleci like mlx пре 1 година
  Alex Cheema 67a1aaa823 check processes in github workflow пре 1 година
  Alex Cheema 9a3ac273a9 Merge pull request #77 from Cloud1590/main пре 1 година
  Alex Cheema 628d8679b0 force mlx inference engine in github workflow, where it defaults to tinygrad because it's running on 'model': 'Apple Virtual Machine 1', 'chip': 'Apple M1 (Virtual)' пре 1 година
  Alex Cheema e856d7f7f9 log chatgpt integration test output from each process on github workflow failure пре 1 година
  Alex Cheema 5a23376059 add log_request middleware if DEBUG>=2 to chatgpt api to debug api issues, default always to llama-3.1-8b пре 1 година
  Alex Cheema 2084784470 per-request kv cache, remove all explicit reset functionality as it wasnt used. fixes #67 пре 1 година
  Alex Cheema dd8c5d63a9 add support for mistral nemo and mistral large пре 1 година
  Alex Cheema 03fe7a058c more robust message parsing fixes #81 пре 1 година
  Cloud1590 0770c59d5f Update main.py пре 1 година
  Cloud1590 e1792e29b9 chore: Update argparse action for --disable-tui flag пре 1 година
  Cloud1590 2c71a4b1ac Update device_capabilities.py пре 1 година
  Alex Cheema 942012577a styling for tinychat model selector пре 1 година
  Alex Cheema 5ac6b6a717 clearer documentation on accessing web UI and chatgpt-api пре 1 година
  Alex Cheema 9a373c2bb0 make configurable discovery timeout пре 1 година
  Alex Cheema 63a05d5b4f make configurable discovery timeout пре 1 година
  Alex Cheema 8d2bb819bf add llama-3.1 notice to README пре 1 година
  Alex Cheema 7a2fbf22b9 add model selection to tinychat пре 1 година
  Alex Cheema bbfd5adc20 add support for llama3.1 (8b, 70b, 405b). bump mlx up to 0.16.0 and mlx-lm up to 0.16.1. fixes #66 пре 1 година
  Alex Cheema 5496cd85f5 Revert "smart model downloading for mlx #16" пре 1 година
  Alex Cheema 3a230f3b44 smart model downloading for mlx #16 пре 1 година
  Alex Cheema 174cff071e Merge pull request #58 from jakobdylanc/main пре 1 година
  Alex Cheema b0e7dd9d2d add max-generate-tokens flag fixes #54 пре 1 година
  JakobDylanC f2f61ccee6 inference engine selection improvements пре 1 година
  Alex Cheema 4e46232364 add simple prometheus metrics collection, with a prometheus / grafana instance for live dashboard. related: #22 пре 1 година
  Alex Cheema 2e419ba211 Merge pull request #48 from itsknk/intel-mac пре 1 година
  itsknk e934664168 implement dynamic inference engine selection пре 1 година
  Alex Cheema 1fcbe18baa fix m2 ultra flops пре 1 година
  Alex Cheema 9d9d257eb2 reduce chatgpt api response timeout in test пре 1 година
  Alex Cheema 8850187b8a tell the mofo in the workflow to keep responses concise пре 1 година