Nel Nibcord
|
b7bbda3348
Removed tinygrad StatefulModel class, as it's no longer used
|
8 mesi fa |
Nel Nibcord
|
67f5ae25a5
Fixing tinygrad model
|
8 mesi fa |
Nel Nibcord
|
bfa3b36be5
Fixing tinygrad model
|
8 mesi fa |
Nel Nibcord
|
37a75d6b96
Fixing tinygrad model
|
8 mesi fa |
Nel Nibcord
|
0d3abfca95
Made models save properly
|
8 mesi fa |
Nel Nibcord
|
9283f6d7bd
Correct loss propagation so we can see the actual loss instead of just the requestor shard's loss
|
8 mesi fa |
Nel Nibcord
|
9eadee310b
Basic model saving
|
8 mesi fa |
Nel Nibcord
|
38e368f00b
Fixed up the ops so that batches work
|
8 mesi fa |
Nel Nibcord
|
dd3d99043b
Working distributed training
|
8 mesi fa |
Nel Nibcord
|
175ebc1c42
Coordination biz
|
8 mesi fa |
Nel Nibcord
|
3e869051f6
Okay we should probably await the update
|
8 mesi fa |
Nel Nibcord
|
75c8650f1f
Naive network-propagated loss implementation on MLX
|
8 mesi fa |
Nel Nibcord
|
836856824e
WIP: Training works on mlx
|
8 mesi fa |
Nel Nibcord
|
a6fd7a3430
Generalizing some of the dataset biz while also creating uniform batches
|
8 mesi fa |
Nel Nibcord
|
f5efbe1b8f
Initial distributed evaluation implementation
|
8 mesi fa |
Alex Cheema
|
8a5d212cfc
test 20
|
8 mesi fa |
Alex Cheema
|
53edb8508b
test 19
|
8 mesi fa |
Alex Cheema
|
29d9df04bf
test 18
|
8 mesi fa |
Alex Cheema
|
4d6af6e6ca
test 17
|
8 mesi fa |
Alex Cheema
|
8c7c156f57
test 16
|
8 mesi fa |
Alex Cheema
|
310843487f
test 15
|
8 mesi fa |
Alex Cheema
|
a4b221d0a0
test 14
|
8 mesi fa |
Alex Cheema
|
286db875de
test 13
|
8 mesi fa |
Alex Cheema
|
d714e40f62
test 12
|
8 mesi fa |
Alex Cheema
|
e78ef75531
test 11
|
8 mesi fa |
Alex Cheema
|
38eaecf087
test 10
|
8 mesi fa |
Alex Cheema
|
3cf28f8452
test 9
|
8 mesi fa |
Alex Cheema
|
9ba8bbdd70
test 8
|
8 mesi fa |
Alex Cheema
|
af6048e373
test 7
|
8 mesi fa |
Alex Cheema
|
d93b8e8948
test 6
|
8 mesi fa |