Hermes Agent — wenn KI sich selbst verbessert.
Im Februar 2026 veröffentlichte das Forschungs-Kollektiv Nous Research einen Agenten, der nicht nur Aufgaben löst, sondern sich beim Lösen selbst beibringt, wie er es nächstes Mal besser macht. Innerhalb von sieben Wochen sammelte das Repository über 95.000 GitHub-Sterne. Wir erklären, was wirklich dahintersteckt — und wo die Grenzen liegen.
„Self-improving" und „persistent memory" sind 2026 die Buzz-Wörter der Agenten-Szene. Hermes Agent ist das erste Open-Source-Projekt, das beide Konzepte ernst meint — und das macht es zum Lehrstück für alle, die verstehen wollen, wo agentische KI gerade hingeht.
Nous Research ist in der Open-Source-Welt kein Neuling. Die Gruppe hat sich seit 2023 mit Fine-Tuning-Projekten (Hermes-Modell-Reihe) einen Namen gemacht. Der neue „Hermes Agent" baut auf dieser Erfahrung auf, ist aber etwas ganz anderes: kein Modell, sondern ein Agent-Framework, das LLMs in einen kontinuierlich lernenden Workflow einbettet.
Ein Agent, der ein Gedächtnis hat
Klassische LLM-Agenten leiden alle am gleichen Problem: Wenn das Chat-Fenster zu ist, ist alles vergessen. Mehrere Frameworks (LangChain, AutoGen, CrewAI) versuchen das mit Vektor-Datenbanken zu umgehen — meist als optionalen Aufsatz. Hermes hat es von Anfang an als Kern-Mechanik eingebaut:
- Jede Konversation wird strukturiert abgelegt (volle Suche möglich).
- Der Agent fordert sich selbst auf, wichtige Erkenntnisse als „Persistent Knowledge" zu speichern.
- Bei Folge-Sessions zieht er passende Erinnerungen ohne explizite Aufforderung in den Kontext.
Praktisches Beispiel: Du erklärst dem Agenten in Sitzung 1, dass dein Code-Standard 2 Leerzeichen statt Tabs benutzt. In Sitzung 27 — sechs Wochen später — schreibt er weiter im richtigen Stil.
Der „Skill Loop"
So funktioniert es konkret:
- Beobachtung: Der Agent löst eine Aufgabe, sagen wir „PDF-Rechnungen in CSV exportieren". Er notiert die einzelnen Schritte.
- Generalisierung: Wenn die gleiche Aufgabe mit Variationen mehrfach kommt, fasst er sie in einen wiederverwendbaren Skill zusammen.
- Wiederverwendung: Bei der nächsten ähnlichen Anfrage wählt er den Skill direkt und überspringt den Lernpfad.
- Verfeinerung: Klappt etwas nicht, wird der Skill angepasst. Klappen die Schritte schneller, wird der Skill optimiert.
Wichtige Einschränkung: Das ist kein Reinforcement Learning des Basis-Modells. Der Agent baut sich eine Bibliothek von Workflows, das LLM darunter bleibt unverändert. Aus Compliance-Sicht ist das ein riesiger Vorteil — das Modell wird nicht verändert, nur die Steuerschicht darüber.
Installation, Hardware, Modelle
Setup-Profile in der Praxis:
- Laptop-Setup: macOS oder Linux mit Ollama, 7B–13B-Modell. Reicht für Schreib- und Recherche-Workflows.
- Workstation-Setup: Eine ordentliche GPU (24+ GB VRAM) für 30B-Modelle. Hermes glänzt bei längeren Multi-Step-Aufgaben.
- API-Setup: Lokaler Hermes-Agent, aber das LLM kommt aus der Cloud (OpenAI, Anthropic, Mistral La Plateforme). Geringere Hardware-Hürde, höhere Datenschutz-Aufmerksamkeit.
Lizenz: MIT — freie kommerzielle Nutzung erlaubt.
Memory Poisoning — die unangenehme Schattenseite
Das Tückische daran: Anders als bei klassischer Prompt Injection (die endet, wenn das Chat-Fenster zu ist) persistiert die Manipulation. Der Agent „lernt" eine falsche Info und ruft sie Tage oder Wochen später als gegebene Tatsache ab.
Gegenmaßnahmen, die Hermes bereits eingebaut hat:
- Memory Auditing: Jeder Eintrag hat einen Quell-Pointer (welche Session, welche Quelle).
- Review-Mechanismus: Der User kann jederzeit alle Memory-Einträge durchsehen und einzelne löschen.
- Trust-Marker: Inhalte aus externen Quellen (Web, fremde Dateien) werden anders markiert als direkte User-Inputs.
Das ist kein perfekter Schutz — aber ein deutlich erwachsenerer Ansatz als bei vielen anderen Agenten. Mehr zu Angriffs-Mustern in unserem Begleit-Artikel Agentic AI Security 2026.
Wofür — und wofür nicht
Gut geeignet:
- Einzel-User, die täglich mit denselben Tools arbeiten (Entwickler, Forscher, Analysten).
- Lange Recherche-Projekte über Wochen, wo Kontinuität wertvoll ist.
- Eigene Coding-Workflows mit persistenten Style-Präferenzen.
Weniger geeignet:
- Team-Setups mit geteiltem Agenten — die Memory ist pro-User strukturiert, nicht pro-Team.
- Compliance-relevante Workflows ohne dokumentierte Memory-Bereinigungs-Prozesse (DSGVO: Auskunfts- und Löschanspruch müssen technisch greifen).
- Production-Use, in dem ein deterministisches Verhalten erwartet wird — Self-Improving heißt: das Verhalten ändert sich über die Zeit.
Hermes Agent vs. OpenClaw — die Kurzfassung
Beide sind Open-Source-Agenten, beide laufen lokal, beide hatten in 2026 ein virales Moment. Die Unterschiede:
- OpenClaw ist breit angelegt: viele Skills, jede Plattform, schnell installiert. Stark in „mach mal diese Datei-Operation, dann diesen API-Call".
- Hermes Agent ist tiefer angelegt: weniger eingebaute Skills, aber Persistenz und Selbst-Optimierung. Stark in „arbeite mich über Wochen tief in mein Projekt ein".
Es ist kein Entweder-Oder — in der Praxis nutzen Power-User oft beide Tools für unterschiedliche Aufgaben.
Wie Hermes Agent und Snowbyte zusammenhängen
Hermes Agent ist ein eigenständiges Projekt — nicht von Snowbyte. Aber auf einem Snow-PC kannst du es problemlos installieren und mit dem lokalen LLM aus SnowChat als Engine verbinden. Der Reiz: Memory-Daten bleiben auf deinem Gerät, kein externer Cloud-Hop.
Wer ein fertiges System mit Multi-Agenten, Berechtigungs-Modell und EU-AI-Act-Audit-Trail sucht — ohne das Selbst-Bauen — schaut sich SnowDesk an. Hermes ist der Maker-Spielplatz; SnowDesk ist die Werkbank.
Was du als Nächstes lesen solltest
Für den breiteren Agenten-Trend: OpenClaw — Der Open-Source-Agent, der über Nacht zum Phänomen wurde.
Für die Sicherheits-Seite (besonders relevant bei persistentem Memory): Agentic AI Security 2026 — die 4 wichtigsten Bedrohungen.
Quellen
- hermes-agent.nousresearch.com — offizielle Projektseite.
- github.com/NousResearch/hermes-agent — Source, Releases, Lizenz (MIT).
- hermes-agent.nousresearch.com/docs — aktuelle Dokumentation.
- GitHub Releases — Versions-Historie.
Wissens-Check — sichere dir den Fortschritt
5 Fragen, Multiple Choice. Ab 4 von 5 richtig wird der Artikel in deinem Zertifizierungs-Pfad als bestanden vermerkt. Du brauchst einen Snowbyte-Account, um den Fortschritt zu speichern.
Lies weiter mit Snow Academy — ab 14 €/Monat.
Dieser Artikel ist Teil der gepflegten Snow Academy. Mit einem Privat- oder Business-Abo bekommst du vollen Zugriff auf alle Artikel, Quizze und das Zertifizierungs-Programm.