reasonAI – Erklärbares Schlussfolgern in grossen Sprachmodellen (LLMs)

Beschreibung

Das Projekt zielt darauf ab, die Erklärbarkeit großer Sprachmodelle zu verbessern, indem systematische Interventionen, wie zum Beispiel Sparse Autoencoder, auf Open-Source-Reasoning-Modelle wie Qwen Deepseek-R1 angewendet werden.

Transparente, KI-basierte Schlussfolgerungen sind insbesondere in den Lebenswissenschaften wichtig, wo vertrauenswürdige Entscheidungen von foundational models essenziell sind.