Teil 1 | Post-Memory-Training: Agenten das Erinnern beibringen, nicht nur das Abrufen
Das Training des Post-Speichers war in den letzten Monaten ein Schwerpunkt meiner Arbeit. Wenn Sie meine jüngsten Beiträge zum Kontextmanagement, zu Speicherarchitekturen und zur immer wiederkehrenden Frage, warum Agenten nach Runde 50 an Leistung verlieren, verfolgt haben, laufen diese Fäden in diesem Artikel zusammen. Das ursprüngliche Muster war klar genug. Acht unabhängige Forschungsteams kamen zu demselben Ergebnis: Man sollte aufhören, Speichersysteme um das Modell herum aufzubauen, und stattdessen das Modell selbst trainieren, Speicher als erlernte Fähigkeit zu verwalten. Diese Übereinstimmung war von großer Bedeutung.






