Alex Cheema
|
2fb961fccd
stick to same convention as new llama
|
1 рік тому |
Alex Cheema
|
b44b917151
add pillow as testing dependency
|
1 рік тому |
Alex Cheema
|
2aa1e24ea9
remove unused torch import
|
1 рік тому |
Alex Cheema
|
833e7f3396
rename sharded_llava -> llava to match new convention
|
1 рік тому |
Alex Cheema
|
7d5eed1111
Merge branch 'main' into HEAD
|
1 рік тому |
Alex Cheema
|
044d189ccc
Merge pull request #94 from mzbac/mlx_refactor
|
1 рік тому |
Alex Cheema
|
909d5ef8ba
Merge branch 'main' into mlx_refactor
|
1 рік тому |
Alex Cheema
|
63e51a8270
formatting
|
1 рік тому |
Alex Cheema
|
6695b019a2
format format.py
|
1 рік тому |
Alex Cheema
|
1dc08fecaa
increase max line length to 200
|
1 рік тому |
Alex Cheema
|
444137776a
formatting
|
1 рік тому |
Anchen
|
a6bb8ddf41
update deepseek sanitize to shard layers first before handle switch
|
1 рік тому |
Alex Cheema
|
cb217b7b77
format format.py
|
1 рік тому |
Alex Cheema
|
4cb36a7f55
increase max line length to 200
|
1 рік тому |
Alex Cheema
|
d94e3f9ce4
formatting
|
1 рік тому |
Anchen
|
666b1c83ee
refactor(mlx): model sharding and add deepseek v2 support
|
1 рік тому |
Alex Cheema
|
931ced7c01
fix a few more linter errors
|
1 рік тому |
Alex Cheema
|
57b2f2a4e2
fix ruff lint errors
|
1 рік тому |
Alex Cheema
|
ce761038ac
formatting / linting
|
1 рік тому |
Alex Cheema
|
f1bd5fe152
Merge pull request #90 from xeb/main
|
1 рік тому |
Alex Cheema
|
f051ebe6e0
remove accidentally added files
|
1 рік тому |
Mark Kockerbeck
|
5eafd5a305
try/except for decode, #75
|
1 рік тому |
Varshith
|
2849128d6a
processor load
|
1 рік тому |
Varshith Bathini
|
6ed76b3493
Merge branch 'main' into main
|
1 рік тому |
Varshith
|
54993995dc
conflicts
|
1 рік тому |
Varshith
|
9d2616b9cf
shareded inference
|
1 рік тому |
Alex Cheema
|
faa1319470
disable chatgpt api integration test, github changed something in their mac runners? perhaps time to switch over to circleci like mlx
|
1 рік тому |
Alex Cheema
|
67a1aaa823
check processes in github workflow
|
1 рік тому |
Alex Cheema
|
9a3ac273a9
Merge pull request #77 from Cloud1590/main
|
1 рік тому |
Alex Cheema
|
628d8679b0
force mlx inference engine in github workflow, where it defaults to tinygrad because it's running on 'model': 'Apple Virtual Machine 1', 'chip': 'Apple M1 (Virtual)'
|
1 рік тому |