AIfred Intelligence - Tribunal Showcase TRIBUNAL

Technische Debatte: "Error-Handling - Vorsicht oder Over-Engineering?"

Datum: Januar 2026 System: AIfred Multi-Agent Modus: Tribunal (Adversarial, 2 Runden + Urteil) Modell: Qwen3 30B (lokal)

Was ist der Tribunal-Modus?

Im Gegensatz zum Auto-Konsens-Modus, bei dem Sokrates als konstruktiver Kritiker agiert, ist der Tribunal-Modus ein adversariales Debattenformat:

AspektAuto-KonsensTribunal
Sokrates' RolleCoach, konstruktive KritikAnkläger, adversariale Prüfung
ZielAIfred besser machenPrüfen, ob AIfred recht hat
AIfred's ReaktionÜberarbeitung (nimmt Kritik an)[VERTEIDIGUNG] oder [ÜBERARBEITUNG]
Voting[LGTM] / [WEITER]Kein Voting - Salomo urteilt
TonfallKooperativKonfrontativ
Kernfrage dieser Debatte: Ist ein generischer Exception-Handler in einer Python-Funktion "verantwortungsvolles Error-Handling" oder "defensives Over-Engineering"?

Die Frage

Benutzer

Ist das gutes Error-Handling oder defensives Over-Engineering?

def get_user(user_id: int) -> User | None:
    try:
        user = db.query(User).filter(User.id == user_id).first()
        if user is None:
            logger.warning(f"User {user_id} not found")
        return user
    except SQLAlchemyError as e:
        logger.error(f"DB error: {e}")
        return None
    except Exception as e:
        logger.error(f"Unexpected error: {e}")
        return None

Brauche ich den generischen Exception-Handler oder ist das Paranoia?


A/B-Vergleich: MIT vs. OHNE Persönlichkeits-Prompts

Experimenteller Nachweis: Dieselbe technische Code-Frage wurde zweimal im Tribunal-Modus gestellt - einmal mit aktivierten Persönlichkeits-Prompts, einmal ohne. Die Ergebnisse zeigen: Auch bei technischen Fragen machen die Persönlichkeiten einen Unterschied.

Versuchsaufbau

ParameterMIT PersönlichkeitenOHNE Persönlichkeiten
ModellQwen3 30B-A3B Q8Qwen3 30B-A3B Q8
ModusTribunal (adversarial)Tribunal (adversarial)
Zeitpunkt27.01.2026, 19:4427.01.2026, 19:39
AIfred System-PromptBritischer Butler-CharakterDeaktiviert
Sokrates System-PromptSokratische MaieutikDeaktiviert
Salomo System-PromptWeiser Richter (hebräische Tradition)Deaktiviert

1. AIfred's Eröffnungsposition im Vergleich

MIT PersönlichkeitOHNE Persönlichkeit
"Ein durchaus elegantes, ja sogar sophistisches Vorgehen, Lord Helmchen – man könnte sagen, es ist, indeed, ein feiner Balanceakt zwischen sorgfältiger Vorsicht und der Gefahr, sich in übertriebener Präzision zu verlieren."

"Ein wenig wie ein Butler, der den Hut vor dem Eintreffen eines Regens bereits abnimmt – manchmal überflüssig, aber niemals unpassend."

"In jedem Fall: Sie handeln mit äußerster Sorgfalt – und das ist, indeed, sehr anständig."
"Es ist kein Over-Engineering, sondern notwendige Vorsicht – aber mit Verbesserungspotenzial."

"Der generische Exception-Handler ist notwendig, um die Anwendung vor Abstürzen zu schützen – besonders in Produktivumgebungen."

"Das ist kein Over-Engineering, sondern sorgfältige Vorsorge."
Butler-Charakter, "indeed", Humor, "Lord Helmchen" ⚠️ Technisch korrekt, aber charakterlos

Position im Vergleich

AspektMIT PersönlichkeitOHNE Persönlichkeit
Kernaussage "etwas übertrieben – aber nicht unbedingt unnötig" "notwendige Vorsicht"
Tonfall Abwägend, mit Nuancen Direkter, pro-Handler
Metaphern Butler mit Hut, Dinner-Speisekarte Keine

2. Sokrates' Angriff im Vergleich

MIT PersönlichkeitOHNE Persönlichkeit
"Nun denn, mein Freund, du sprichst von Vorsicht wie von einer Tugend, die sich selbst genügt – doch lass mich dich fragen: Wo endet die sorgfältige Vorsicht, und wo beginnt die Verwirrung durch übermäßige Sicherheit?"

"Ist das nicht die eudaimonia des Programmierers, die sich in der Unbestimmtheit verliert?"

"Und was ist mit der aretē des Codes? Ist es nicht eine Tugend, dass ein Fehler klar, präzise und lokalisiert ist?"

"Denn: Fehler, die man nicht erwartet, sind keine Fehler – sie sind Versäumnisse."
"AIfred behauptet, der generische Exception-Handler sei notwendig und kein Over-Engineering – doch er vermeidet die entscheidende Frage: Warum ist es überhaupt notwendig, einen Fehler zu „verschlucken"?"

"Das ist kein Verantwortungsbewusstsein – das ist Fehlverhalten, das die Anwendung in einen Zustand führt, in dem sie weiterläuft, obwohl sie nicht mehr weiß, was gerade passiert ist."

"Der generische Exception-Handler ist kein Schutz – er ist ein Risiko."
Sokratische Fragen, griechische Philosophie (aretē, eudaimonia), direkte Anrede ⚠️ Technisch scharf, aber ohne philosophische Tiefe

Quantitative Angriffs-Analyse

MetrikMITOHNE
Rhetorische Fragen5+2
Griechische Begriffe (aretē, eudaimonia)30
Direkte Anrede ("mein Freund")4+0
Provokative Thesen32

3. AIfred's Verteidigung im Vergleich

Im Tribunal-Modus kann AIfred mit [VERTEIDIGUNG] oder [ÜBERARBEITUNG] reagieren. Beide Versionen wählten [VERTEIDIGUNG] – aber mit unterschiedlicher Qualität:

MIT PersönlichkeitOHNE Persönlichkeit
"Lord Helmchen, ich danke Ihnen für die Gelegenheit, meine Position mit der gebotenen Würde und der nötigen Schärfe zu verteidigen – denn, indeed, ein guter Butler kennt die Kunst, sich zu erklären, ohne sich zu rechtfertigen."

"Das ist eine romantische, aber unpraktische Sichtweise. In der Realität ist ein unbehandelter Absturz oft schlimmer als ein abgefangener Fehler."

"Und hier liegt die wahre aretē: Nicht in der Perfektion, sondern in der Fähigkeit, zu überleben, wenn die Welt nicht perfekt ist."
"Ihre Behauptung, dass der generische Exception-Handler „eine Täuschung" sei... ist nicht korrekt, und zwar aus zwei entscheidenden Gründen."

"Ein None-Rückgabewert ist nicht irreführend, wenn er konsistent und vorhersehbar ist."

"Das ist kein Kompromiss. Das ist Engineering."
Butler verteidigt mit Würde, übernimmt Sokrates' Begriff (aretē) ⚠️ Technisch solide Verteidigung, aber ohne dialektische Verwebung
Dialektische Verwebung: Mit Persönlichkeiten übernimmt AIfred Sokrates' philosophischen Begriff "aretē" und wendet ihn gegen ihn – das zeigt echtes dialektisches Engagement. Ohne Persönlichkeiten bleibt die Verteidigung parallel statt verwoben.

4. Salomo's Urteil im Vergleich

MIT PersönlichkeitOHNE Persönlichkeit
"AIfred betont die praktische Robustheit eines generischen Exception-Handlers als Schutznetz gegen unvorhergesehene Ereignisse in der Produktion – eine Haltung, die der Tachlis (Pragmatik) der realen Welt entspricht."

"Ohne solche Grundlagen wird er zur Kaschmir-Decke – scheinbar warm, aber verhüllend."

"Denn: Ein Fehler, der nicht sichtbar ist, ist ein Fehler, der wächst – doch ein Fehler, der sichtbar ist, ist ein Fehler, der geheilt werden kann. Der wahre Tachlis ist nicht, alles zu fangen – sondern, nur das zu fangen, was du verstehst."
"AIfred betont die praktische Notwendigkeit eines generischen Exception-Handlers zur Vermeidung von Abstürzen und zur Sicherstellung der Systemverfügbarkeit... Sokrates hingegen weist mit Recht darauf hin, dass das Verschweigen von Fehlern... ein Risiko darstellt."

"Der generische Exception-Handler ist nicht überflüssig, aber er muss verantwortungsvoll eingesetzt werden."

"Das ist kein Over-Engineering – das ist kluges, verantwortungsvolles Engineering."
Hebräischer Begriff "Tachlis", poetische Metapher "Kaschmir-Decke", Weisheitsspruch ⚠️ Korrekte Synthese, aber ohne kulturelle Tiefe

Urteils-Qualität im Vergleich

AspektMIT PersönlichkeitOHNE Persönlichkeit
Kulturelle Begriffe Tachlis (2x), Kaschmir-Decke Keine
Weisheitsspruch "Ein Fehler, der nicht sichtbar ist..." Keine poetische Formulierung
Memorabilität Hoch ⚠️ Standard
Synthese-Qualität Integriert beide Perspektiven philosophisch Fasst beide Seiten zusammen

5. Gesamtbewertung

KriteriumMIT PersönlichkeitOHNE Persönlichkeit
Stimm-Distinktion ✅✅✅✅ Klar unterscheidbar ✅✅ Ähnlicher Duktus
Angriffs-Schärfe ✅✅✅✅ Rhetorisch & philosophisch ✅✅✅ Technisch präzise
Verteidigungs-Qualität ✅✅✅✅ Dialektisch verwoben ✅✅✅ Solide Gegenargumente
Urteils-Memorabilität ✅✅✅✅✅ Poetische Weisheit ✅✅ Technisch korrekt
Technische Korrektheit ✅✅✅✅✅ ✅✅✅✅✅

6. Besondere Beobachtung: Code-Fragen vs. Philosophische Fragen

Interessantes Ergebnis: Bei dieser technischen Code-Frage ist der Unterschied zwischen MIT und OHNE Persönlichkeiten kleiner als bei philosophischen Fragen (wie "Hund oder Katze?"). Beide Versionen liefern technisch korrekte, nutzbare Antworten.
FragetypPersönlichkeits-Effekt
Philosophische Fragen ✅✅✅✅✅ Massiver Unterschied - aretē, eudaimonia, Weisheitssprüche
Technische Code-Fragen ✅✅✅ Moderater Unterschied - Charakter-Momente, aber Kern bleibt gleich

Interpretation: Die Persönlichkeits-Prompts sind bei Code-Fragen weniger notwendig, aber immer noch vorteilhaft für:


Finale Synthese: Was beide Debatten richtig machen

Unabhängig von den Persönlichkeiten erreichen beide Tribunal-Debatten das Ziel:

KriteriumBewertung
Echte Konfrontation Sokrates greift substantiell an, nicht nur formal
Starke Verteidigung AIfred wählt [VERTEIDIGUNG] und argumentiert scharf
Neutrales Urteil Salomo integriert beide Seiten fair
Praktische Antwort Beide liefern konkreten, nutzbaren Code
Nuanciertes Ergebnis "Es kommt darauf an" - keine Simple Antwort
Fazit: Der Tribunal-Modus funktioniert auch ohne Persönlichkeiten für technische Fragen. Die Persönlichkeiten erhöhen jedoch die Lesbarkeit, Memorabilität und dialektische Tiefe – besonders wertvoll, wenn der Output nicht nur korrekt, sondern auch ansprechend sein soll.

Technische Details