{
  "benchmark.actions.delete": "Benchmark löschen",
  "benchmark.actions.delete.confirm": "Sind Sie sicher, dass Sie diesen Benchmark löschen möchten? Verknüpfte Datensätze und Bewertungsaufzeichnungen werden ebenfalls gelöscht.",
  "benchmark.actions.edit": "Benchmark bearbeiten",
  "benchmark.actions.export": "Exportieren",
  "benchmark.card.bestScore": "Beste",
  "benchmark.card.caseCount": "{{count}} Fälle",
  "benchmark.card.datasetCount": "{{count}} Datensätze",
  "benchmark.card.empty": "Noch keine Bewertungen",
  "benchmark.card.emptyHint": "Erstellen Sie eine neue Bewertung auf der Benchmark-Detailseite",
  "benchmark.card.importDataset": "Datensatz importieren",
  "benchmark.card.noDataset": "Noch keine Datensätze",
  "benchmark.card.noDatasetHint": "Importieren Sie einen Datensatz, um mit der Bewertung zu beginnen",
  "benchmark.card.noRecentRuns": "Keine aktuellen Bewertungen anzuzeigen",
  "benchmark.card.recentRuns": "Aktuelle Bewertungen",
  "benchmark.card.runCount": "{{count}} Bewertungen",
  "benchmark.card.startFirst": "Erste Bewertung starten",
  "benchmark.card.viewAll": "Alle {{count}} anzeigen",
  "benchmark.create.confirm": "Erstellen",
  "benchmark.create.description.label": "Beschreibung",
  "benchmark.create.description.placeholder": "Benchmark-Beschreibung (optional)",
  "benchmark.create.error": "Benchmark konnte nicht erstellt werden",
  "benchmark.create.identifier.label": "Kennung",
  "benchmark.create.identifier.placeholder": "benchmark-kennung",
  "benchmark.create.identifierRequired": "Bitte geben Sie eine Kennung ein",
  "benchmark.create.name.label": "Name",
  "benchmark.create.name.placeholder": "Benchmark-Namen eingeben",
  "benchmark.create.nameRequired": "Bitte geben Sie einen Benchmark-Namen ein",
  "benchmark.create.success": "Benchmark erfolgreich erstellt",
  "benchmark.create.tags.label": "Tags",
  "benchmark.create.tags.placeholder": "Tags hinzufügen, getrennt durch Komma oder Leerzeichen",
  "benchmark.create.title": "Benchmark erstellen",
  "benchmark.detail.backToOverview": "Zurück zur Übersicht",
  "benchmark.detail.datasetCount": "{{count}} Datensatz{{count, plural, one {} other {e}}} in diesem Benchmark",
  "benchmark.detail.runCount": "{{count}} Bewertungsdurchlauf{{count, plural, one {} other {e}}} auf diesem Benchmark",
  "benchmark.detail.stats.addFirstDataset": "Klicken, um den ersten Datensatz hinzuzufügen",
  "benchmark.detail.stats.avgCost": "Durchschn. Kosten",
  "benchmark.detail.stats.avgDuration": "Durchschn. Dauer",
  "benchmark.detail.stats.basedOnLastNRuns": "Basierend auf den letzten {{count}} Durchläufen",
  "benchmark.detail.stats.bestPerformance": "Beste Leistung von {{agent}} mit {{passRate}}% Erfolgsquote",
  "benchmark.detail.stats.bestScore": "Beste Punktzahl",
  "benchmark.detail.stats.cases": "Fälle",
  "benchmark.detail.stats.dataScale": "Datenumfang",
  "benchmark.detail.stats.datasets": "Datensätze",
  "benchmark.detail.stats.needSetup": "Einrichtung erforderlich",
  "benchmark.detail.stats.noEvalRecord": "Noch keine Bewertungsaufzeichnungen",
  "benchmark.detail.stats.perRun": "/ Durchlauf",
  "benchmark.detail.stats.runs": "Durchläufe",
  "benchmark.detail.stats.tags": "Tags",
  "benchmark.detail.stats.topAgents": "Top-Agenten",
  "benchmark.detail.stats.totalCases": "Gesamtanzahl der Fälle",
  "benchmark.detail.stats.waiting": "Warten...",
  "benchmark.detail.tabs.data": "Daten",
  "benchmark.detail.tabs.datasets": "Datensätze",
  "benchmark.detail.tabs.runs": "Durchläufe",
  "benchmark.edit.confirm": "Speichern",
  "benchmark.edit.error": "Benchmark konnte nicht aktualisiert werden",
  "benchmark.edit.success": "Benchmark erfolgreich aktualisiert",
  "benchmark.edit.title": "Benchmark bearbeiten",
  "benchmark.empty": "Noch keine Benchmarks. Erstellen Sie einen, um zu beginnen.",
  "caseDetail.actual": "Tatsächliche Ausgabe",
  "caseDetail.chatArea.title": "Konversation",
  "caseDetail.completionReason": "Status",
  "caseDetail.cost": "Kosten",
  "caseDetail.difficulty": "Schwierigkeit",
  "caseDetail.duration": "Dauer",
  "caseDetail.expected": "Erwartete Ausgabe",
  "caseDetail.failureReason": "Fehlergrund",
  "caseDetail.input": "Eingabe",
  "caseDetail.judgeComment": "Kommentar des Richters",
  "caseDetail.resources": "Ressourcen",
  "caseDetail.score": "Punktzahl",
  "caseDetail.section.runtime": "Laufzeit",
  "caseDetail.section.scoring": "Bewertungsdetails",
  "caseDetail.section.testCase": "Testfall",
  "caseDetail.steps": "Schritte",
  "caseDetail.threads.attempt": "Verlauf #{{number}}",
  "caseDetail.tokens": "Token-Nutzung",
  "common.cancel": "Abbrechen",
  "common.create": "Erstellen",
  "common.delete": "Löschen",
  "common.edit": "Bearbeiten",
  "common.later": "Später",
  "common.next": "Weiter",
  "common.update": "Aktualisieren",
  "dataset.actions.addDataset": "Datensatz hinzufügen",
  "dataset.actions.import": "Daten importieren",
  "dataset.actions.importDataset": "Datensatz importieren",
  "dataset.create.description.label": "Beschreibung",
  "dataset.create.description.placeholder": "Datensatzbeschreibung (optional)",
  "dataset.create.error": "Datensatz konnte nicht erstellt werden",
  "dataset.create.identifier.label": "Kennung",
  "dataset.create.identifier.placeholder": "datensatz-kennung",
  "dataset.create.identifierRequired": "Bitte geben Sie eine Kennung ein",
  "dataset.create.importNow": "Möchten Sie jetzt Daten importieren?",
  "dataset.create.name.label": "Datensatzname",
  "dataset.create.name.placeholder": "Datensatznamen eingeben",
  "dataset.create.nameRequired": "Bitte geben Sie einen Datensatznamen ein",
  "dataset.create.preset.label": "Datensatz-Voreinstellung",
  "dataset.create.success": "Datensatz erfolgreich erstellt",
  "dataset.create.successTitle": "Datensatz erstellt",
  "dataset.create.title": "Datensatz erstellen",
  "dataset.delete.confirm": "Sind Sie sicher, dass Sie diesen Datensatz löschen möchten? Alle darin enthaltenen Testfälle werden ebenfalls gelöscht.",
  "dataset.delete.error": "Datensatz konnte nicht gelöscht werden",
  "dataset.delete.success": "Datensatz erfolgreich gelöscht",
  "dataset.detail.addRun": "Neuer Durchlauf",
  "dataset.detail.backToBenchmark": "Zurück zum Benchmark",
  "dataset.detail.caseCount": "{{count}} Testfall{{count, plural, one {} other {e}}}",
  "dataset.detail.relatedRuns": "Verknüpfte Durchläufe ({{count}})",
  "dataset.detail.testCases": "Testfälle",
  "dataset.detail.viewDetail": "Details anzeigen",
  "dataset.edit.error": "Datensatz konnte nicht aktualisiert werden",
  "dataset.edit.success": "Datensatz erfolgreich aktualisiert",
  "dataset.edit.title": "Datensatz bearbeiten",
  "dataset.empty": "Keine Datensätze",
  "dataset.empty.description": "Importieren Sie einen Datensatz, um diesen Benchmark zu erstellen",
  "dataset.empty.title": "Noch keine Datensätze",
  "dataset.evalMode.hint": "Standard-Bewertungsmodus für den Datensatz, kann auf Testfall-Ebene überschrieben werden",
  "dataset.import.category": "Kategorie",
  "dataset.import.categoryDesc": "Klassifikationslabel zur Gruppierung",
  "dataset.import.choices": "Auswahlmöglichkeiten",
  "dataset.import.choicesDesc": "Optionen für Mehrfachauswahl",
  "dataset.import.confirm": "Importieren",
  "dataset.import.error": "Datensatz konnte nicht importiert werden",
  "dataset.import.expected": "Erwartete Antwort",
  "dataset.import.expectedDelimiter": "Antwort-Trennzeichen",
  "dataset.import.expectedDelimiter.desc": "Antwort-Trennzeichen",
  "dataset.import.expectedDelimiter.placeholder": "z. B. | oder ,",
  "dataset.import.expectedDesc": "Korrekte Antwort zum Vergleich",
  "dataset.import.fieldMapping": "Feldzuordnung",
  "dataset.import.fieldMapping.desc": "\"Eingabe\"-Spalte ist erforderlich",
  "dataset.import.hideSkipped": "Übersprungene Spalten ausblenden",
  "dataset.import.ignore": "Überspringen",
  "dataset.import.ignoreDesc": "Diese Spalte nicht importieren",
  "dataset.import.input": "Eingabe",
  "dataset.import.inputDesc": "Frage oder Eingabeaufforderung an das Modell",
  "dataset.import.metadata": "Metadaten",
  "dataset.import.metadataDesc": "Zusätzliche Informationen, werden unverändert gespeichert",
  "dataset.import.next": "Weiter",
  "dataset.import.parseError": "Datei konnte nicht analysiert werden",
  "dataset.import.parsing": "Datei wird analysiert...",
  "dataset.import.prev": "Zurück",
  "dataset.import.preview": "Datenvorschau",
  "dataset.import.preview.desc": "Bestätigen Sie, dass die Zuordnung korrekt ist, und importieren Sie dann.",
  "dataset.import.preview.rows": "{{count}} Zeilen insgesamt",
  "dataset.import.sortOrder": "Artikelnummer",
  "dataset.import.sortOrderDesc": "Frage-/Artikel-ID zur Referenz",
  "dataset.import.step.mapping": "Felder zuordnen",
  "dataset.import.step.preview": "Vorschau",
  "dataset.import.step.upload": "Datei hochladen",
  "dataset.import.success": "{{count}} Testfälle erfolgreich importiert",
  "dataset.import.title": "Datensatz importieren",
  "dataset.import.upload.hint": "Unterstützt CSV, XLSX, JSON, JSONL",
  "dataset.import.upload.text": "Klicken oder Datei hierher ziehen, um hochzuladen",
  "dataset.import.uploading": "Hochladen...",
  "dataset.switchDataset": "Datensatz wechseln",
  "difficulty.easy": "Einfach",
  "difficulty.hard": "Schwierig",
  "difficulty.medium": "Mittel",
  "evalMode.answer-relevance": "LLM-Relevanz",
  "evalMode.answer-relevance.desc": "Verwenden Sie LLM, um die Relevanz der Antwort zu bewerten (ja oder nein)",
  "evalMode.contains": "Enthält Übereinstimmung",
  "evalMode.contains.desc": "Ausgabe muss den erwarteten Text enthalten",
  "evalMode.equals": "Exakte Übereinstimmung",
  "evalMode.equals.desc": "Ausgabe muss genau mit der erwarteten übereinstimmen",
  "evalMode.external": "Externe Bewertung",
  "evalMode.external.desc": "Agent läuft bis zum Abschluss; die Bewertung wird von einem externen System durchgeführt",
  "evalMode.label": "Bewertungsmodus",
  "evalMode.llm-rubric": "LLM-Richter",
  "evalMode.llm-rubric.desc": "Verwenden Sie LLM, um die Ausgabequalität zu bewerten",
  "evalMode.placeholder": "Bewertungsmodus auswählen",
  "evalMode.prompt.label": "Richter-Aufforderung",
  "evalMode.prompt.placeholder": "Geben Sie die Bewertungskriterien oder die Aufforderung für den LLM-Richter ein",
  "evalMode.rubric": "Rubrik-Bewertung",
  "evalMode.rubric.desc": "Bewerten Sie die Ausgabe mit Benchmark-Rubriken und gewichteten Kriterien",
  "overview.createBenchmark": "Benchmark erstellen",
  "overview.importDataset": "Datensatz importieren",
  "overview.subtitle": "Bewerten und vergleichen Sie Ihre KI-Agenten über Datensätze hinweg",
  "overview.title": "Bewertungslabor",
  "run.actions.abort": "Abbrechen",
  "run.actions.abort.confirm": "Sind Sie sicher, dass Sie diese Bewertung abbrechen möchten?",
  "run.actions.batchResume": "Stapelwiederaufnahme",
  "run.actions.batchResume.modal.confirm": "Ausgewählte fortsetzen",
  "run.actions.batchResume.modal.selectAll": "Alle auswählen",
  "run.actions.batchResume.modal.selected": "{{count}} ausgewählt",
  "run.actions.batchResume.modal.title": "Fälle stapelweise wieder aufnehmen",
  "run.actions.create": "Neue Bewertung",
  "run.actions.delete": "Löschen",
  "run.actions.delete.confirm": "Sind Sie sicher, dass Sie diese Bewertung löschen möchten?",
  "run.actions.edit": "Bearbeiten",
  "run.actions.resumeCase": "Fortsetzen",
  "run.actions.retryCase": "Erneut versuchen",
  "run.actions.retryErrors": "Fehler erneut versuchen",
  "run.actions.retryErrors.confirm": "Dies wird alle Fehler- und Timeout-Fälle erneut ausführen. Bestanden und fehlgeschlagene Fälle bleiben unberührt.",
  "run.actions.run": "Ausführen",
  "run.actions.start": "Starten",
  "run.actions.start.confirm": "Sind Sie sicher, dass Sie diese Bewertung starten möchten?",
  "run.chart.duration": "Dauer (s)",
  "run.chart.error": "Fehler",
  "run.chart.fail": "Fehlgeschlagen",
  "run.chart.latencyDistribution": "Latenzverteilung",
  "run.chart.latencyTokenDistribution": "Latenz / Token-Verteilung",
  "run.chart.pass": "Bestanden",
  "run.chart.passFailError": "Bestanden / Fehlgeschlagen / Fehler",
  "run.chart.tokens": "Tokens",
  "run.config.agentId": "Agent",
  "run.config.concurrency": "Parallelität",
  "run.config.judgeModel": "Richter-Modell",
  "run.config.k": "Ausführungen (K)",
  "run.config.k.hint": "Führen Sie jeden Testfall {{k}} Mal für pass@{{k}}/pass^{{k}}-Metriken aus",
  "run.config.maxSteps": "Maximale Schritte",
  "run.config.maxSteps.hint": "Jeder LLM-Aufruf oder Werkzeugaufruf durch den Agenten zählt als 1 Schritt",
  "run.config.model": "Modell",
  "run.config.temperature": "Temperatur",
  "run.config.timeout": "Timeout",
  "run.config.timeout.unit": "min",
  "run.create.advanced": "Erweiterte Einstellungen",
  "run.create.agent": "Agent",
  "run.create.agent.placeholder": "Agent auswählen",
  "run.create.agent.required": "Bitte wählen Sie einen Agenten aus",
  "run.create.caseCount": "{{count}} Fälle",
  "run.create.confirm": "Erstellen & Starten",
  "run.create.createOnly": "Erstellen",
  "run.create.dataset": "Datensatz",
  "run.create.dataset.placeholder": "Datensatz auswählen",
  "run.create.dataset.required": "Bitte wählen Sie einen Datensatz aus",
  "run.create.name": "Bewertungsname",
  "run.create.name.placeholder": "Geben Sie einen Namen für diese Bewertung ein",
  "run.create.name.required": "Bitte geben Sie einen Bewertungsnamen ein",
  "run.create.name.useTimestamp": "Aktuelle Zeit als Namen verwenden",
  "run.create.openAgent": "Agent in neuem Fenster öffnen",
  "run.create.title": "Neue Bewertung",
  "run.create.titleWithDataset": "Neue Bewertung für \"{{dataset}}\"",
  "run.detail.agent": "Agent",
  "run.detail.agent.none": "Nicht angegeben",
  "run.detail.agent.unnamed": "Unbenannter Agent",
  "run.detail.backToBenchmark": "Zurück zum Benchmark",
  "run.detail.caseResults": "Bewertungsdetails",
  "run.detail.config": "Bewertungskonfiguration",
  "run.detail.configSnapshot": "Konfigurations-Snapshot",
  "run.detail.copyRunId": "Run-ID kopieren",
  "run.detail.copyRunIdFailed": "Run-ID konnte nicht kopiert werden",
  "run.detail.copyRunIdSuccess": "Run-ID kopiert",
  "run.detail.dataset": "Datensatz",
  "run.detail.model": "Modell",
  "run.detail.overview": "Übersicht",
  "run.detail.progress": "Fortschritt",
  "run.detail.progressCases": "Fälle",
  "run.detail.report": "Bewertungszusammenfassung",
  "run.edit.error": "Bewertung konnte nicht aktualisiert werden",
  "run.edit.success": "Bewertung erfolgreich aktualisiert",
  "run.edit.title": "Bewertung bearbeiten",
  "run.empty.description": "Starten Sie Ihren ersten Bewertungsdurchlauf für diesen Datensatz",
  "run.empty.descriptionBenchmark": "Starten Sie Ihren ersten Bewertungsdurchlauf für diesen Benchmark",
  "run.empty.title": "Noch keine Durchläufe",
  "run.external.hint": "Ausführung abgeschlossen. Warten auf die Übermittlung der Bewertungsergebnisse durch ein externes System ...",
  "run.filter.active": "Aktiv",
  "run.filter.empty": "Keine Durchläufe entsprechen dem aktuellen Filter.",
  "run.idle.hint": "Klicken Sie auf Start, um die Bewertung zu beginnen",
  "run.metrics.avgScore": "Durchschn. Punktzahl",
  "run.metrics.cost": "Kosten",
  "run.metrics.duration": "Dauer",
  "run.metrics.errorCases": "Fehler",
  "run.metrics.evaluated": "{{count}} bewertet",
  "run.metrics.passRate": "Erfolgsquote",
  "run.metrics.perCase": "/ Fall",
  "run.metrics.tokens": "Tokens",
  "run.metrics.totalDuration": "Kumulativ",
  "run.pending.hint": "Bewertung ist in der Warteschlange und wartet auf den Start...",
  "run.running.hint": "Bewertung läuft, Ergebnisse werden in Kürze angezeigt...",
  "run.status.aborted": "Abgebrochen",
  "run.status.completed": "Abgeschlossen",
  "run.status.completed.tooltip": "Die Ausführung und externe Bewertung sind abgeschlossen.",
  "run.status.error": "Bewertungsfehler",
  "run.status.external": "Bewertung ausstehend",
  "run.status.external.tooltip": "Der Agent hat die Ausführung abgeschlossen. Warten auf die Übermittlung der Bewertungsergebnisse durch ein externes System.",
  "run.status.failed": "Fehlgeschlagen",
  "run.status.idle": "Inaktiv",
  "run.status.pending": "Ausstehend",
  "run.status.running": "Läuft",
  "run.status.timeout": "Zeitüberschreitung",
  "sidebar.benchmarks": "Benchmarks",
  "sidebar.dashboard": "Dashboard",
  "sidebar.datasets": "Datensätze",
  "sidebar.runs": "Durchläufe",
  "table.columns.avgCost": "Durchschn. Kosten",
  "table.columns.category": "Kategorie",
  "table.columns.cost": "Kosten",
  "table.columns.difficulty": "Schwierigkeit",
  "table.columns.duration": "Dauer",
  "table.columns.evalMode": "Bewertungsmodus",
  "table.columns.expected": "Erwartete Antwort",
  "table.columns.input": "Eingabe",
  "table.columns.score": "Punktzahl",
  "table.columns.status": "Status",
  "table.columns.steps": "Schritte",
  "table.columns.tags": "Tags",
  "table.columns.tokens": "Tokens",
  "table.columns.totalCost": "Gesamtkosten",
  "table.filter.all": "Alle",
  "table.filter.error": "Bewertungsfehler",
  "table.filter.failed": "Fehlgeschlagen",
  "table.filter.passed": "Bestanden",
  "table.filter.running": "Läuft",
  "table.search.placeholder": "Fälle suchen...",
  "table.total": "Insgesamt {{count}}",
  "testCase.actions.add": "Testfall hinzufügen",
  "testCase.actions.import": "Testfälle importieren",
  "testCase.create.advanced": "Weitere Optionen",
  "testCase.create.difficulty.label": "Schwierigkeit",
  "testCase.create.error": "Testfall konnte nicht hinzugefügt werden",
  "testCase.create.expected.label": "Erwartete Ausgabe",
  "testCase.create.expected.placeholder": "Geben Sie die erwartete Antwort ein",
  "testCase.create.expected.required": "Bitte geben Sie die erwartete Ausgabe ein",
  "testCase.create.input.label": "Eingabe",
  "testCase.create.input.placeholder": "Geben Sie die Eingabe oder Frage für den Testfall ein",
  "testCase.create.success": "Testfall erfolgreich hinzugefügt",
  "testCase.create.tags.label": "Tags",
  "testCase.create.tags.placeholder": "Kommagetrennte Tags (optional)",
  "testCase.create.title": "Testfall hinzufügen",
  "testCase.delete.confirm": "Sind Sie sicher, dass Sie diesen Testfall löschen möchten?",
  "testCase.delete.error": "Testfall konnte nicht gelöscht werden",
  "testCase.delete.success": "Testfall gelöscht",
  "testCase.edit.error": "Testfall konnte nicht aktualisiert werden",
  "testCase.edit.success": "Testfall erfolgreich aktualisiert",
  "testCase.edit.title": "Testfall bearbeiten",
  "testCase.empty.description": "Importieren oder fügen Sie manuell Testfälle zu diesem Datensatz hinzu",
  "testCase.empty.title": "Noch keine Testfälle",
  "testCase.preview.expected": "Erwartet",
  "testCase.preview.input": "Eingabe",
  "testCase.preview.title": "Testfall-Vorschau",
  "testCase.search.placeholder": "Fälle suchen..."
}