Ein Großteil unseres Forschungsteams hat seine Karriere im HF-Ökosystem verbracht, daher beschleunigt das Halten von Ablations-Checkpoints und Datensätzen dort die Einarbeitung. Aber bei über 100 TB wird das teuer. Wir waren frühe Nutzer von Buckets, und sie waren ausgezeichnet. Sehr zu empfehlen.
Die Nutzung von Trinity, insbesondere während der kostenlosen Phase auf openrouter, war unglaublich.
Wir haben tatsächlich geschafft, 3x mehr Durchsatz in unserem Inferenz-Cluster zu bewältigen, als wir geschätzt hatten. Aber unser TPS ist eingebrochen, da die Nutzung einfach weiter wächst.
Wir haben einige Trainingsressourcen in die Inferenz verschoben (nicht so einfach, wie ich dachte) und sollten bald wieder volle Geschwindigkeit erreichen.
Gib uns alles, was du hast.