Alex Cheema
|
444137776a
formatting
|
1 an în urmă |
Anchen
|
a6bb8ddf41
update deepseek sanitize to shard layers first before handle switch
|
1 an în urmă |
Anchen
|
666b1c83ee
refactor(mlx): model sharding and add deepseek v2 support
|
1 an în urmă |
Alex Cheema
|
931ced7c01
fix a few more linter errors
|
1 an în urmă |
Alex Cheema
|
57b2f2a4e2
fix ruff lint errors
|
1 an în urmă |
Alex Cheema
|
ce761038ac
formatting / linting
|
1 an în urmă |
Alex Cheema
|
f1bd5fe152
Merge pull request #90 from xeb/main
|
1 an în urmă |
Alex Cheema
|
f051ebe6e0
remove accidentally added files
|
1 an în urmă |
Mark Kockerbeck
|
5eafd5a305
try/except for decode, #75
|
1 an în urmă |
Alex Cheema
|
faa1319470
disable chatgpt api integration test, github changed something in their mac runners? perhaps time to switch over to circleci like mlx
|
1 an în urmă |
Alex Cheema
|
67a1aaa823
check processes in github workflow
|
1 an în urmă |
Alex Cheema
|
9a3ac273a9
Merge pull request #77 from Cloud1590/main
|
1 an în urmă |
Alex Cheema
|
628d8679b0
force mlx inference engine in github workflow, where it defaults to tinygrad because it's running on 'model': 'Apple Virtual Machine 1', 'chip': 'Apple M1 (Virtual)'
|
1 an în urmă |
Alex Cheema
|
e856d7f7f9
log chatgpt integration test output from each process on github workflow failure
|
1 an în urmă |
Mark Kockerbeck
|
d2fa7b247e
Showing the message only if successfully decoded, #75
|
1 an în urmă |
Mark Kockerbeck
|
f1cd5ae7a6
Merge branch 'main' of github.com:xeb/exo
|
1 an în urmă |
Mark Kockerbeck
|
4f5ab78d9d
Addressing issue #75 to avoid decoding binary packets
|
1 an în urmă |
Alex Cheema
|
5a23376059
add log_request middleware if DEBUG>=2 to chatgpt api to debug api issues, default always to llama-3.1-8b
|
1 an în urmă |
Alex Cheema
|
2084784470
per-request kv cache, remove all explicit reset functionality as it wasnt used. fixes #67
|
1 an în urmă |
Alex Cheema
|
dd8c5d63a9
add support for mistral nemo and mistral large
|
1 an în urmă |
Alex Cheema
|
03fe7a058c
more robust message parsing fixes #81
|
1 an în urmă |
Cloud1590
|
0770c59d5f
Update main.py
|
1 an în urmă |
Cloud1590
|
e1792e29b9
chore: Update argparse action for --disable-tui flag
|
1 an în urmă |
Cloud1590
|
2c71a4b1ac
Update device_capabilities.py
|
1 an în urmă |
Alex Cheema
|
942012577a
styling for tinychat model selector
|
1 an în urmă |
Alex Cheema
|
5ac6b6a717
clearer documentation on accessing web UI and chatgpt-api
|
1 an în urmă |
Alex Cheema
|
9a373c2bb0
make configurable discovery timeout
|
1 an în urmă |
Alex Cheema
|
63a05d5b4f
make configurable discovery timeout
|
1 an în urmă |
Alex Cheema
|
8d2bb819bf
add llama-3.1 notice to README
|
1 an în urmă |
Alex Cheema
|
7a2fbf22b9
add model selection to tinychat
|
1 an în urmă |