Alex Cheema
|
ae74d2da16
run unit test on llama 3.2 1b for faster test
|
před 9 měsíci |
Alex Cheema
|
ad09b4b3d9
also initialize embed_tokens if last layer and tie_word_embeddings true
|
před 9 měsíci |
Alex Cheema
|
fbc407c6ae
make llama-3.2-1b the default for tests so they run faster
|
před 9 měsíci |
Alex Cheema
|
8950d95ef8
updgrade all mac ci jobs to xcode=16.0.0, resource_class=m2pro.large
|
před 9 měsíci |
LIPERE Benjamin
|
ade9db4dfd
feat(device_capabilities.py): add support for NVIDIA RTX 4000 ADA generation device capabilities
|
před 9 měsíci |
Alex Cheema
|
c1a26cd7fa
Merge pull request #315 from GaetanLepage/a6000-flops
|
před 9 měsíci |
Gaetan Lepage
|
a0ad18c6ad
Fix GPU names for RTX Ampere cards
|
před 9 měsíci |
Alex Cheema
|
eade4fb62d
Merge pull request #310 from exo-explore/udp_discovry_peer_race_condition
|
před 9 měsíci |
Alex Cheema
|
8a69a7a238
one line print
|
před 9 měsíci |
Alex Cheema
|
b7996b9af4
race condition in on_listen_message for udp discovery fixes #308
|
před 9 měsíci |
Alex Cheema
|
27e5ee6b22
Merge pull request #309 from exo-explore/cleanup_peers_race_condition
|
před 9 měsíci |
Alex Cheema
|
e80ee60760
fix the race condition in cleanup peers and run the peer checks concurrently. fixes #308
|
před 9 měsíci |
Alex Cheema
|
48fe7b9130
Merge pull request #306 from exo-explore/process_prompt_shield
|
před 9 měsíci |
Alex Cheema
|
aa20562614
shield process_prompt so downloads dont get cancelled when chatgpt api request times out
|
před 9 měsíci |
Alex Cheema
|
7b2a523fd1
Merge pull request #289 from GaetanLepage/pynvml
|
před 9 měsíci |
Alex Cheema
|
db123884e9
Merge pull request #291 from vanakema/main
|
před 9 měsíci |
Alex Cheema
|
33c0dd8583
Merge pull request #292 from exo-explore/remove_tailscale_package_dependency
|
před 9 měsíci |
Alex Cheema
|
e8a8702377
replace tailscale.devices with good old http, removing the need for tailscale dependency
|
před 9 měsíci |
Mark Van Aken
|
82c7ce69f6
Point `llama-3.1-70b-bf16` model to the actually bf16 version
|
před 9 měsíci |
Gaetan Lepage
|
9ffd8116f0
Use official nvidia-ml-py instead of pynvml
|
před 9 měsíci |
Alex Cheema
|
2b9dec20eb
Merge pull request #282 from exo-explore/unsilence_errors
|
před 9 měsíci |
Alex Cheema
|
9b9f40d470
only stream results for the same request id. this allows multiple concurrent requests on the same LLM without overlapping interference in the streamed outputs
|
před 9 měsíci |
Alex Cheema
|
9223993e29
await node process_prompt with timeoout
|
před 9 měsíci |
Alex Cheema
|
5e0db20426
Merge pull request #278 from exo-explore/peer_prio
|
před 9 měsíci |
Alex Cheema
|
b611d0a5e2
fix print
|
před 9 měsíci |
Alex Cheema
|
ac6f1bedac
add a priority to broadcast messages where the broadcaster can indicate how to prioritise that particular interface. for now all priorities are set to 1 but in the future this will be based on network latency, bandwidth, jitter, etc.. e.g. Thunderbolt prioritised over WiFi
|
před 9 měsíci |
Alex Cheema
|
2654f290c3
Merge pull request #272 from exo-explore/fix_download_progress
|
před 10 měsíci |
Alex Cheema
|
c3864f5e6f
more robust handling of timeouts
|
před 10 měsíci |
Alex Cheema
|
4746ffdd60
clean up download progress
|
před 10 měsíci |
Alex Cheema
|
6b38346974
Merge pull request #258 from DevEmilio96/main
|
před 10 měsíci |