3 parallel models

2026-03-26 20:50:24 -04:00
parent fde7963379
commit 9bd6525dd0
4 changed files with 67 additions and 3 deletions
--- a/users/alice/non-server.nix
+++ b/users/alice/non-server.nix
@@ -85,7 +85,32 @@
            #keep_alive = "15m";
            available_models = [
              {
-                name = "glm-4.7-flash";
+                name = "deepseek-r1:1.5b";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "deepseek-r1:32b";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "deepseek-r1:70b";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "qwen3-coder-next";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "lennyerik/zeta";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "nomic-embed-text:latest";
                max_tokens = 128000;
                keep_alive = "15m";
              }
@@ -94,6 +119,21 @@
                max_tokens = 128000;
                keep_alive = "15m";
              }
+              {
+                name = "glm-4.7-flash";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "nemotron-cascade-2:30b";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
+              {
+                name = "magistral";
+                max_tokens = 128000;
+                keep_alive = "15m";
+              }
            ];
          };
        };