{
"benchmark.actions.delete": "ベンチマークを削除",
"benchmark.actions.delete.confirm": "このベンチマークを削除してもよろしいですか?関連するデータセットと評価記録も削除されます。",
"benchmark.actions.edit": "ベンチマークを編集",
"benchmark.actions.export": "エクスポート",
"benchmark.card.bestScore": "最高",
"benchmark.card.caseCount": "{{count}} ケース",
"benchmark.card.datasetCount": "{{count}} データセット",
"benchmark.card.empty": "まだ評価がありません",
"benchmark.card.emptyHint": "ベンチマーク詳細ページから新しい評価を作成してください",
"benchmark.card.importDataset": "データセットをインポート",
"benchmark.card.noDataset": "まだデータセットがありません",
"benchmark.card.noDatasetHint": "データセットをインポートして評価を開始してください",
"benchmark.card.noRecentRuns": "表示する最近の評価がありません",
"benchmark.card.recentRuns": "最近の評価",
"benchmark.card.runCount": "{{count}} 評価",
"benchmark.card.startFirst": "最初の評価を開始",
"benchmark.card.viewAll": "すべて表示 ({{count}})",
"benchmark.create.confirm": "作成",
"benchmark.create.description.label": "説明",
"benchmark.create.description.placeholder": "ベンチマークの説明(任意)",
"benchmark.create.error": "ベンチマークの作成に失敗しました",
"benchmark.create.identifier.label": "識別子",
"benchmark.create.identifier.placeholder": "ベンチマーク識別子",
"benchmark.create.identifierRequired": "識別子を入力してください",
"benchmark.create.name.label": "名前",
"benchmark.create.name.placeholder": "ベンチマーク名を入力してください",
"benchmark.create.nameRequired": "ベンチマーク名を入力してください",
"benchmark.create.success": "ベンチマークが正常に作成されました",
"benchmark.create.tags.label": "タグ",
"benchmark.create.tags.placeholder": "タグを追加(カンマまたはスペースで区切る)",
"benchmark.create.title": "ベンチマークを作成",
"benchmark.detail.backToOverview": "概要に戻る",
"benchmark.detail.datasetCount": "このベンチマークには {{count}} データセットがあります",
"benchmark.detail.runCount": "このベンチマークには {{count}} 評価実行があります",
"benchmark.detail.stats.addFirstDataset": "最初のデータセットを追加するにはクリックしてください",
"benchmark.detail.stats.avgCost": "平均コスト",
"benchmark.detail.stats.avgDuration": "平均時間",
"benchmark.detail.stats.basedOnLastNRuns": "直近の {{count}} 実行に基づく",
"benchmark.detail.stats.bestPerformance": "{{agent}} による最高のパフォーマンス(合格率 {{passRate}}%)",
"benchmark.detail.stats.bestScore": "最高スコア",
"benchmark.detail.stats.cases": "ケース",
"benchmark.detail.stats.dataScale": "データ規模",
"benchmark.detail.stats.datasets": "データセット",
"benchmark.detail.stats.needSetup": "セットアップが必要です",
"benchmark.detail.stats.noEvalRecord": "まだ評価記録がありません",
"benchmark.detail.stats.perRun": "/ 実行",
"benchmark.detail.stats.runs": "実行",
"benchmark.detail.stats.tags": "タグ",
"benchmark.detail.stats.topAgents": "トップエージェント",
"benchmark.detail.stats.totalCases": "合計ケース数",
"benchmark.detail.stats.waiting": "待機中...",
"benchmark.detail.tabs.data": "データ",
"benchmark.detail.tabs.datasets": "データセット",
"benchmark.detail.tabs.runs": "実行",
"benchmark.edit.confirm": "保存",
"benchmark.edit.error": "ベンチマークの更新に失敗しました",
"benchmark.edit.success": "ベンチマークが正常に更新されました",
"benchmark.edit.title": "ベンチマークを編集",
"benchmark.empty": "まだベンチマークがありません。作成して開始してください。",
"caseDetail.actual": "実際の出力",
"caseDetail.chatArea.title": "会話",
"caseDetail.completionReason": "ステータス",
"caseDetail.cost": "コスト",
"caseDetail.difficulty": "難易度",
"caseDetail.duration": "時間",
"caseDetail.expected": "期待される出力",
"caseDetail.failureReason": "失敗理由",
"caseDetail.input": "入力",
"caseDetail.judgeComment": "審査コメント",
"caseDetail.resources": "リソース",
"caseDetail.score": "スコア",
"caseDetail.section.runtime": "ランタイム",
"caseDetail.section.scoring": "スコアリング詳細",
"caseDetail.section.testCase": "テストケース",
"caseDetail.steps": "ステップ",
"caseDetail.threads.attempt": "試行 #{{number}}",
"caseDetail.tokens": "トークン使用量",
"common.cancel": "キャンセル",
"common.create": "作成",
"common.delete": "削除",
"common.edit": "編集",
"common.later": "後で",
"common.next": "次へ",
"common.update": "更新",
"dataset.actions.addDataset": "データセットを追加",
"dataset.actions.import": "データをインポート",
"dataset.actions.importDataset": "データセットをインポート",
"dataset.create.description.label": "説明",
"dataset.create.description.placeholder": "データセットの説明(任意)",
"dataset.create.error": "データセットの作成に失敗しました",
"dataset.create.identifier.label": "識別子",
"dataset.create.identifier.placeholder": "データセット識別子",
"dataset.create.identifierRequired": "識別子を入力してください",
"dataset.create.importNow": "今すぐデータをインポートしますか?",
"dataset.create.name.label": "データセット名",
"dataset.create.name.placeholder": "データセット名を入力してください",
"dataset.create.nameRequired": "データセット名を入力してください",
"dataset.create.preset.label": "データセットプリセット",
"dataset.create.success": "データセットが正常に作成されました",
"dataset.create.successTitle": "データセットが作成されました",
"dataset.create.title": "データセットを作成",
"dataset.delete.confirm": "このデータセットを削除してもよろしいですか?すべてのテストケースも削除されます。",
"dataset.delete.error": "データセットの削除に失敗しました",
"dataset.delete.success": "データセットが正常に削除されました",
"dataset.detail.addRun": "新しい実行",
"dataset.detail.backToBenchmark": "ベンチマークに戻る",
"dataset.detail.caseCount": "{{count}} テストケース",
"dataset.detail.relatedRuns": "関連する実行 ({{count}})",
"dataset.detail.testCases": "テストケース",
"dataset.detail.viewDetail": "詳細を表示",
"dataset.edit.error": "データセットの更新に失敗しました",
"dataset.edit.success": "データセットが正常に更新されました",
"dataset.edit.title": "データセットを編集",
"dataset.empty": "データセットがありません",
"dataset.empty.description": "データセットをインポートしてこのベンチマークを構築してください",
"dataset.empty.title": "まだデータセットがありません",
"dataset.evalMode.hint": "デフォルトの評価モード(テストケースレベルで上書き可能)",
"dataset.import.category": "カテゴリ",
"dataset.import.categoryDesc": "グループ化のための分類ラベル",
"dataset.import.choices": "選択肢",
"dataset.import.choicesDesc": "複数選択肢のオプション",
"dataset.import.confirm": "インポート",
"dataset.import.error": "データセットのインポートに失敗しました",
"dataset.import.expected": "期待される回答",
"dataset.import.expectedDelimiter": "回答区切り文字",
"dataset.import.expectedDelimiter.desc": "回答の区切り文字",
"dataset.import.expectedDelimiter.placeholder": "例: | または ,",
"dataset.import.expectedDesc": "比較する正解",
"dataset.import.fieldMapping": "フィールドマッピング",
"dataset.import.fieldMapping.desc": "「入力」列は必須です",
"dataset.import.hideSkipped": "スキップされた列を非表示",
"dataset.import.ignore": "スキップ",
"dataset.import.ignoreDesc": "この列をインポートしない",
"dataset.import.input": "入力",
"dataset.import.inputDesc": "モデルに送信される質問またはプロンプト",
"dataset.import.metadata": "メタデータ",
"dataset.import.metadataDesc": "追加情報(そのまま保存)",
"dataset.import.next": "次へ",
"dataset.import.parseError": "ファイルの解析に失敗しました",
"dataset.import.parsing": "ファイルを解析中...",
"dataset.import.prev": "前へ",
"dataset.import.preview": "データプレビュー",
"dataset.import.preview.desc": "マッピングが正しいことを確認してからインポートしてください。",
"dataset.import.preview.rows": "合計 {{count}} 行",
"dataset.import.sortOrder": "アイテム番号",
"dataset.import.sortOrderDesc": "参照用の質問/アイテムID",
"dataset.import.step.mapping": "フィールドをマッピング",
"dataset.import.step.preview": "プレビュー",
"dataset.import.step.upload": "ファイルをアップロード",
"dataset.import.success": "{{count}} テストケースが正常にインポートされました",
"dataset.import.title": "データセットをインポート",
"dataset.import.upload.hint": "CSV、XLSX、JSON、JSONL をサポート",
"dataset.import.upload.text": "クリックまたはファイルをドラッグしてアップロード",
"dataset.import.uploading": "アップロード中...",
"dataset.switchDataset": "データセットを切り替え",
"difficulty.easy": "簡単",
"difficulty.hard": "難しい",
"difficulty.medium": "中程度",
"evalMode.answer-relevance": "LLM関連性",
"evalMode.answer-relevance.desc": "LLMを使用して回答の関連性を評価します(はいまたはいいえ)",
"evalMode.contains": "部分一致",
"evalMode.contains.desc": "出力に期待されるテキストが含まれている必要があります",
"evalMode.equals": "完全一致",
"evalMode.equals.desc": "出力が期待されるものと完全に一致する必要があります",
"evalMode.external": "外部評価",
"evalMode.external.desc": "エージェントが完了するまで実行され、スコアリングは外部システムによって処理されます",
"evalMode.label": "評価モード",
"evalMode.llm-rubric": "LLM審査",
"evalMode.llm-rubric.desc": "LLMを使用して出力品質を評価",
"evalMode.placeholder": "評価モードを選択",
"evalMode.prompt.label": "審査プロンプト",
"evalMode.prompt.placeholder": "LLM審査用の評価基準またはプロンプトを入力",
"evalMode.rubric": "ルーブリックスコアリング",
"evalMode.rubric.desc": "重み付け基準を使用してベンチマークルーブリックで出力をスコアリング",
"overview.createBenchmark": "ベンチマークを作成",
"overview.importDataset": "データセットをインポート",
"overview.subtitle": "データセットを通じてAIエージェントをベンチマークおよび評価",
"overview.title": "評価ラボ",
"run.actions.abort": "中止",
"run.actions.abort.confirm": "この評価を中止してもよろしいですか?",
"run.actions.batchResume": "一括再開",
"run.actions.batchResume.modal.confirm": "選択を再開",
"run.actions.batchResume.modal.selectAll": "すべて選択",
"run.actions.batchResume.modal.selected": "{{count}} 件選択済み",
"run.actions.batchResume.modal.title": "ケースの一括再開",
"run.actions.create": "新しい評価",
"run.actions.delete": "削除",
"run.actions.delete.confirm": "この評価を削除してもよろしいですか?",
"run.actions.edit": "編集",
"run.actions.resumeCase": "再開",
"run.actions.retryCase": "再試行",
"run.actions.retryErrors": "エラーを再試行",
"run.actions.retryErrors.confirm": "これにより、すべてのエラーおよびタイムアウトケースが再実行されます。合格および失敗したケースには影響しません。",
"run.actions.run": "実行",
"run.actions.start": "開始",
"run.actions.start.confirm": "この評価を開始してもよろしいですか?",
"run.chart.duration": "時間 (秒)",
"run.chart.error": "エラー",
"run.chart.fail": "失敗",
"run.chart.latencyDistribution": "レイテンシ分布",
"run.chart.latencyTokenDistribution": "レイテンシ / トークン分布",
"run.chart.pass": "合格",
"run.chart.passFailError": "合格 / 失敗 / エラー",
"run.chart.tokens": "トークン",
"run.config.agentId": "エージェント",
"run.config.concurrency": "同時実行数",
"run.config.judgeModel": "審査モデル",
"run.config.k": "実行回数 (K)",
"run.config.k.hint": "各テストケースを {{k}} 回実行して pass@{{k}}/pass^{{k}} メトリクスを取得",
"run.config.maxSteps": "最大ステップ数",
"run.config.maxSteps.hint": "エージェントによる各LLM呼び出しまたはツール呼び出しが1ステップとカウントされます",
"run.config.model": "モデル",
"run.config.temperature": "温度",
"run.config.timeout": "タイムアウト",
"run.config.timeout.unit": "分",
"run.create.advanced": "詳細設定",
"run.create.agent": "エージェント",
"run.create.agent.placeholder": "エージェントを選択",
"run.create.agent.required": "エージェントを選択してください",
"run.create.caseCount": "{{count}} ケース",
"run.create.confirm": "作成して開始",
"run.create.createOnly": "作成のみ",
"run.create.dataset": "データセット",
"run.create.dataset.placeholder": "データセットを選択",
"run.create.dataset.required": "データセットを選択してください",
"run.create.name": "実行名",
"run.create.name.placeholder": "この実行の名前を入力",
"run.create.name.required": "実行名を入力してください",
"run.create.name.useTimestamp": "現在の時刻を名前として使用",
"run.create.openAgent": "新しいウィンドウでエージェントを開く",
"run.create.title": "新しい評価",
"run.create.titleWithDataset": "\"{{dataset}}\" の新しい評価",
"run.detail.agent": "エージェント",
"run.detail.agent.none": "指定なし",
"run.detail.agent.unnamed": "名前のないエージェント",
"run.detail.backToBenchmark": "ベンチマークに戻る",
"run.detail.caseResults": "評価詳細",
"run.detail.config": "評価設定",
"run.detail.configSnapshot": "設定スナップショット",
"run.detail.copyRunId": "実行IDをコピー",
"run.detail.copyRunIdFailed": "実行IDのコピーに失敗しました",
"run.detail.copyRunIdSuccess": "実行IDをコピーしました",
"run.detail.dataset": "データセット",
"run.detail.model": "モデル",
"run.detail.overview": "概要",
"run.detail.progress": "進行状況",
"run.detail.progressCases": "ケース",
"run.detail.report": "評価サマリー",
"run.edit.error": "評価の更新に失敗しました",
"run.edit.success": "評価が正常に更新されました",
"run.edit.title": "評価を編集",
"run.empty.description": "このデータセットで最初の評価実行を開始してください",
"run.empty.descriptionBenchmark": "このベンチマークで最初の評価実行を開始してください",
"run.empty.title": "まだ実行がありません",
"run.external.hint": "実行が完了しました。外部システムが評価結果を送信するのを待っています...",
"run.filter.active": "アクティブ",
"run.filter.empty": "現在のフィルターに一致する実行はありません。",
"run.idle.hint": "開始をクリックして評価を開始してください",
"run.metrics.avgScore": "平均スコア",
"run.metrics.cost": "コスト",
"run.metrics.duration": "時間",
"run.metrics.errorCases": "エラー",
"run.metrics.evaluated": "{{count}} 評価済み",
"run.metrics.passRate": "合格率",
"run.metrics.perCase": "/ ケース",
"run.metrics.tokens": "トークン",
"run.metrics.totalDuration": "累積",
"run.pending.hint": "評価がキューに入り、開始を待っています...",
"run.running.hint": "評価が実行中です。結果はまもなく表示されます...",
"run.status.aborted": "中止",
"run.status.completed": "完了",
"run.status.completed.tooltip": "実行と外部スコアリングが完了しました。",
"run.status.error": "実行エラー",
"run.status.external": "評価待ち",
"run.status.external.tooltip": "エージェントの実行が完了しました。外部システムが評価結果を送信するのを待っています。",
"run.status.failed": "失敗",
"run.status.idle": "アイドル",
"run.status.pending": "保留中",
"run.status.running": "実行中",
"run.status.timeout": "タイムアウト",
"sidebar.benchmarks": "ベンチマーク",
"sidebar.dashboard": "ダッシュボード",
"sidebar.datasets": "データセット",
"sidebar.runs": "実行",
"table.columns.avgCost": "平均コスト",
"table.columns.category": "カテゴリ",
"table.columns.cost": "コスト",
"table.columns.difficulty": "難易度",
"table.columns.duration": "時間",
"table.columns.evalMode": "評価モード",
"table.columns.expected": "期待される回答",
"table.columns.input": "入力",
"table.columns.score": "スコア",
"table.columns.status": "ステータス",
"table.columns.steps": "ステップ",
"table.columns.tags": "タグ",
"table.columns.tokens": "トークン",
"table.columns.totalCost": "総コスト",
"table.filter.all": "すべて",
"table.filter.error": "実行エラー",
"table.filter.failed": "失敗",
"table.filter.passed": "合格",
"table.filter.running": "実行中",
"table.search.placeholder": "ケースを検索...",
"table.total": "合計 {{count}}",
"testCase.actions.add": "テストケースを追加",
"testCase.actions.import": "テストケースをインポート",
"testCase.create.advanced": "詳細オプション",
"testCase.create.difficulty.label": "難易度",
"testCase.create.error": "テストケースの追加に失敗しました",
"testCase.create.expected.label": "期待される出力",
"testCase.create.expected.placeholder": "期待される回答を入力",
"testCase.create.expected.required": "期待される出力を入力してください",
"testCase.create.input.label": "入力",
"testCase.create.input.placeholder": "テストケースの入力または質問を入力",
"testCase.create.success": "テストケースが正常に追加されました",
"testCase.create.tags.label": "タグ",
"testCase.create.tags.placeholder": "カンマ区切りのタグ(任意)",
"testCase.create.title": "テストケースを追加",
"testCase.delete.confirm": "このテストケースを削除してもよろしいですか?",
"testCase.delete.error": "テストケースの削除に失敗しました",
"testCase.delete.success": "テストケースが削除されました",
"testCase.edit.error": "テストケースの更新に失敗しました",
"testCase.edit.success": "テストケースが正常に更新されました",
"testCase.edit.title": "テストケースを編集",
"testCase.empty.description": "このデータセットにテストケースをインポートまたは手動で追加してください",
"testCase.empty.title": "まだテストケースがありません",
"testCase.preview.expected": "期待される出力",
"testCase.preview.input": "入力",
"testCase.preview.title": "テストケースプレビュー",
"testCase.search.placeholder": "ケースを検索..."
}