{
"benchmark.actions.delete": "Eliminar Benchmark",
"benchmark.actions.delete.confirm": "¿Estás seguro de que deseas eliminar este benchmark? Los conjuntos de datos relacionados y los registros de evaluación también se eliminarán.",
"benchmark.actions.edit": "Editar Benchmark",
"benchmark.actions.export": "Exportar",
"benchmark.card.bestScore": "Mejor",
"benchmark.card.caseCount": "{{count}} casos",
"benchmark.card.datasetCount": "{{count}} conjuntos de datos",
"benchmark.card.empty": "Aún no hay evaluaciones",
"benchmark.card.emptyHint": "Crea una nueva evaluación desde la página de detalles del benchmark",
"benchmark.card.importDataset": "Importar Conjunto de Datos",
"benchmark.card.noDataset": "Aún no hay conjuntos de datos",
"benchmark.card.noDatasetHint": "Importa un conjunto de datos para comenzar a evaluar",
"benchmark.card.noRecentRuns": "No hay evaluaciones recientes para mostrar",
"benchmark.card.recentRuns": "Evaluaciones Recientes",
"benchmark.card.runCount": "{{count}} evaluaciones",
"benchmark.card.startFirst": "Iniciar Primera Evaluación",
"benchmark.card.viewAll": "Ver todos {{count}}",
"benchmark.create.confirm": "Crear",
"benchmark.create.description.label": "Descripción",
"benchmark.create.description.placeholder": "Descripción del benchmark (opcional)",
"benchmark.create.error": "Error al crear el benchmark",
"benchmark.create.identifier.label": "Identificador",
"benchmark.create.identifier.placeholder": "identificador-del-benchmark",
"benchmark.create.identifierRequired": "Por favor, ingresa un identificador",
"benchmark.create.name.label": "Nombre",
"benchmark.create.name.placeholder": "Ingresa el nombre del benchmark",
"benchmark.create.nameRequired": "Por favor, ingresa un nombre para el benchmark",
"benchmark.create.success": "Benchmark creado exitosamente",
"benchmark.create.tags.label": "Etiquetas",
"benchmark.create.tags.placeholder": "Agrega etiquetas, separadas por comas o espacios",
"benchmark.create.title": "Crear Benchmark",
"benchmark.detail.backToOverview": "Volver al Resumen",
"benchmark.detail.datasetCount": "{{count}} conjunto{{count, plural, one {} other {s}}} de datos en este benchmark",
"benchmark.detail.runCount": "{{count}} ejecución{{count, plural, one {} other {es}}} de evaluación en este benchmark",
"benchmark.detail.stats.addFirstDataset": "Haz clic para agregar el primer conjunto de datos",
"benchmark.detail.stats.avgCost": "Costo Promedio",
"benchmark.detail.stats.avgDuration": "Duración Promedio",
"benchmark.detail.stats.basedOnLastNRuns": "Basado en las últimas {{count}} ejecuciones",
"benchmark.detail.stats.bestPerformance": "Mejor rendimiento por {{agent}} con {{passRate}}% de tasa de éxito",
"benchmark.detail.stats.bestScore": "Mejor Puntaje",
"benchmark.detail.stats.cases": "Casos",
"benchmark.detail.stats.dataScale": "Escala de Datos",
"benchmark.detail.stats.datasets": "Conjuntos de Datos",
"benchmark.detail.stats.needSetup": "Configuración Requerida",
"benchmark.detail.stats.noEvalRecord": "Aún no hay registros de evaluación",
"benchmark.detail.stats.perRun": "/ Ejecución",
"benchmark.detail.stats.runs": "Ejecuciones",
"benchmark.detail.stats.tags": "Etiquetas",
"benchmark.detail.stats.topAgents": "Mejores Agentes",
"benchmark.detail.stats.totalCases": "Total de Casos",
"benchmark.detail.stats.waiting": "Esperando...",
"benchmark.detail.tabs.data": "Datos",
"benchmark.detail.tabs.datasets": "Conjuntos de Datos",
"benchmark.detail.tabs.runs": "Ejecuciones",
"benchmark.edit.confirm": "Guardar",
"benchmark.edit.error": "Error al actualizar el benchmark",
"benchmark.edit.success": "Benchmark actualizado exitosamente",
"benchmark.edit.title": "Editar Benchmark",
"benchmark.empty": "Aún no hay benchmarks. Crea uno para comenzar.",
"caseDetail.actual": "Salida Real",
"caseDetail.chatArea.title": "Conversación",
"caseDetail.completionReason": "Estado",
"caseDetail.cost": "Costo",
"caseDetail.difficulty": "Dificultad",
"caseDetail.duration": "Duración",
"caseDetail.expected": "Salida Esperada",
"caseDetail.failureReason": "Razón del Fallo",
"caseDetail.input": "Entrada",
"caseDetail.judgeComment": "Comentario del Juez",
"caseDetail.resources": "Recursos",
"caseDetail.score": "Puntaje",
"caseDetail.section.runtime": "Tiempo de Ejecución",
"caseDetail.section.scoring": "Detalles de Puntuación",
"caseDetail.section.testCase": "Caso de Prueba",
"caseDetail.steps": "Pasos",
"caseDetail.threads.attempt": "Trayectoria #{{number}}",
"caseDetail.tokens": "Uso de Tokens",
"common.cancel": "Cancelar",
"common.create": "Crear",
"common.delete": "Eliminar",
"common.edit": "Editar",
"common.later": "Más tarde",
"common.next": "Siguiente",
"common.update": "Actualizar",
"dataset.actions.addDataset": "Agregar Conjunto de Datos",
"dataset.actions.import": "Importar Datos",
"dataset.actions.importDataset": "Importar Conjunto de Datos",
"dataset.create.description.label": "Descripción",
"dataset.create.description.placeholder": "Descripción del conjunto de datos (opcional)",
"dataset.create.error": "Error al crear el conjunto de datos",
"dataset.create.identifier.label": "Identificador",
"dataset.create.identifier.placeholder": "identificador-del-conjunto-de-datos",
"dataset.create.identifierRequired": "Por favor, ingresa un identificador",
"dataset.create.importNow": "¿Te gustaría importar datos ahora?",
"dataset.create.name.label": "Nombre del Conjunto de Datos",
"dataset.create.name.placeholder": "Ingresa el nombre del conjunto de datos",
"dataset.create.nameRequired": "Por favor, ingresa un nombre para el conjunto de datos",
"dataset.create.preset.label": "Preajuste del Conjunto de Datos",
"dataset.create.success": "Conjunto de datos creado exitosamente",
"dataset.create.successTitle": "Conjunto de Datos Creado",
"dataset.create.title": "Crear Conjunto de Datos",
"dataset.delete.confirm": "¿Estás seguro de que deseas eliminar este conjunto de datos? Todos los casos de prueba en él también se eliminarán.",
"dataset.delete.error": "Error al eliminar el conjunto de datos",
"dataset.delete.success": "Conjunto de datos eliminado exitosamente",
"dataset.detail.addRun": "Nueva Ejecución",
"dataset.detail.backToBenchmark": "Volver al Benchmark",
"dataset.detail.caseCount": "{{count}} caso{{count, plural, one {} other {s}}} de prueba",
"dataset.detail.relatedRuns": "Ejecuciones Relacionadas ({{count}})",
"dataset.detail.testCases": "Casos de Prueba",
"dataset.detail.viewDetail": "Ver Detalles",
"dataset.edit.error": "Error al actualizar el conjunto de datos",
"dataset.edit.success": "Conjunto de datos actualizado exitosamente",
"dataset.edit.title": "Editar Conjunto de Datos",
"dataset.empty": "No hay conjuntos de datos",
"dataset.empty.description": "Importa un conjunto de datos para comenzar a construir este benchmark",
"dataset.empty.title": "Aún no hay conjuntos de datos",
"dataset.evalMode.hint": "Modo de evaluación predeterminado para el conjunto de datos, puede ser sobrescrito a nivel de caso de prueba",
"dataset.import.category": "Categoría",
"dataset.import.categoryDesc": "Etiqueta de clasificación para agrupación",
"dataset.import.choices": "Opciones",
"dataset.import.choicesDesc": "Opciones de selección múltiple",
"dataset.import.confirm": "Importar",
"dataset.import.error": "Error al importar el conjunto de datos",
"dataset.import.expected": "Respuesta Esperada",
"dataset.import.expectedDelimiter": "Delimitador de Respuesta",
"dataset.import.expectedDelimiter.desc": "Delimitador de respuesta",
"dataset.import.expectedDelimiter.placeholder": "por ejemplo, | o ,",
"dataset.import.expectedDesc": "Respuesta correcta para comparar",
"dataset.import.fieldMapping": "Mapeo de Campos",
"dataset.import.fieldMapping.desc": "La columna \"Entrada\" es obligatoria",
"dataset.import.hideSkipped": "Ocultar columnas omitidas",
"dataset.import.ignore": "Omitir",
"dataset.import.ignoreDesc": "No importar esta columna",
"dataset.import.input": "Entrada",
"dataset.import.inputDesc": "Pregunta o indicación enviada al modelo",
"dataset.import.metadata": "Metadatos",
"dataset.import.metadataDesc": "Información adicional, almacenada tal cual",
"dataset.import.next": "Siguiente",
"dataset.import.parseError": "Error al analizar el archivo",
"dataset.import.parsing": "Analizando archivo...",
"dataset.import.prev": "Anterior",
"dataset.import.preview": "Vista Previa de Datos",
"dataset.import.preview.desc": "Confirma que el mapeo es correcto, luego importa.",
"dataset.import.preview.rows": "{{count}} filas en total",
"dataset.import.sortOrder": "Número de Ítem",
"dataset.import.sortOrderDesc": "ID de pregunta/ítem para referencia",
"dataset.import.step.mapping": "Mapear Campos",
"dataset.import.step.preview": "Vista Previa",
"dataset.import.step.upload": "Subir Archivo",
"dataset.import.success": "Importados exitosamente {{count}} casos de prueba",
"dataset.import.title": "Importar Conjunto de Datos",
"dataset.import.upload.hint": "Soporta CSV, XLSX, JSON, JSONL",
"dataset.import.upload.text": "Haz clic o arrastra el archivo aquí para subirlo",
"dataset.import.uploading": "Subiendo...",
"dataset.switchDataset": "Cambiar Conjunto de Datos",
"difficulty.easy": "Fácil",
"difficulty.hard": "Difícil",
"difficulty.medium": "Medio",
"evalMode.answer-relevance": "Relevancia de LLM",
"evalMode.answer-relevance.desc": "Usar LLM para evaluar la relevancia de la respuesta (sí o no)",
"evalMode.contains": "Coincidencia Contenida",
"evalMode.contains.desc": "La salida debe contener el texto esperado",
"evalMode.equals": "Coincidencia Exacta",
"evalMode.equals.desc": "La salida debe ser exactamente igual a la esperada",
"evalMode.external": "Evaluación Externa",
"evalMode.external.desc": "El agente se ejecuta hasta completarse; la puntuación es manejada por un sistema externo",
"evalMode.label": "Modo de Evaluación",
"evalMode.llm-rubric": "Juez LLM",
"evalMode.llm-rubric.desc": "Usar LLM para evaluar la calidad de la salida",
"evalMode.placeholder": "Selecciona el modo de evaluación",
"evalMode.prompt.label": "Indicación del Juez",
"evalMode.prompt.placeholder": "Ingresa los criterios de evaluación o la indicación para el juez LLM",
"evalMode.rubric": "Evaluación por Rubrica",
"evalMode.rubric.desc": "Evaluar la salida usando rúbricas del benchmark con criterios ponderados",
"overview.createBenchmark": "Crear Benchmark",
"overview.importDataset": "Importar Conjunto de Datos",
"overview.subtitle": "Evalúa y compara tus agentes de IA en diferentes conjuntos de datos",
"overview.title": "Laboratorio de Evaluación",
"run.actions.abort": "Abortar",
"run.actions.abort.confirm": "¿Estás seguro de que deseas abortar esta evaluación?",
"run.actions.batchResume": "Reanudar en Lote",
"run.actions.batchResume.modal.confirm": "Reanudar Seleccionados",
"run.actions.batchResume.modal.selectAll": "Seleccionar Todo",
"run.actions.batchResume.modal.selected": "{{count}} seleccionados",
"run.actions.batchResume.modal.title": "Reanudar Casos en Lote",
"run.actions.create": "Nueva Evaluación",
"run.actions.delete": "Eliminar",
"run.actions.delete.confirm": "¿Estás seguro de que deseas eliminar esta evaluación?",
"run.actions.edit": "Editar",
"run.actions.resumeCase": "Reanudar",
"run.actions.retryCase": "Reintentar",
"run.actions.retryErrors": "Reintentar Errores",
"run.actions.retryErrors.confirm": "Esto volverá a ejecutar todos los casos de error y tiempo de espera. Los casos aprobados y fallidos no se verán afectados.",
"run.actions.run": "Ejecutar",
"run.actions.start": "Iniciar",
"run.actions.start.confirm": "¿Estás seguro de que deseas iniciar esta evaluación?",
"run.chart.duration": "Duración (s)",
"run.chart.error": "Error",
"run.chart.fail": "Fallo",
"run.chart.latencyDistribution": "Distribución de Latencia",
"run.chart.latencyTokenDistribution": "Latencia / Distribución de Tokens",
"run.chart.pass": "Aprobado",
"run.chart.passFailError": "Aprobado / Fallo / Error",
"run.chart.tokens": "Tokens",
"run.config.agentId": "Agente",
"run.config.concurrency": "Concurrencia",
"run.config.judgeModel": "Modelo del Juez",
"run.config.k": "Ejecuciones (K)",
"run.config.k.hint": "Ejecuta cada caso de prueba {{k}} veces para métricas pass@{{k}}/pass^{{k}}",
"run.config.maxSteps": "Pasos Máximos",
"run.config.maxSteps.hint": "Cada llamada LLM o herramienta por el agente cuenta como 1 paso",
"run.config.model": "Modelo",
"run.config.temperature": "Temperatura",
"run.config.timeout": "Tiempo de Espera",
"run.config.timeout.unit": "min",
"run.create.advanced": "Configuraciones Avanzadas",
"run.create.agent": "Agente",
"run.create.agent.placeholder": "Selecciona un agente",
"run.create.agent.required": "Por favor, selecciona un agente",
"run.create.caseCount": "{{count}} casos",
"run.create.confirm": "Crear e Iniciar",
"run.create.createOnly": "Crear",
"run.create.dataset": "Conjunto de Datos",
"run.create.dataset.placeholder": "Selecciona un conjunto de datos",
"run.create.dataset.required": "Por favor, selecciona un conjunto de datos",
"run.create.name": "Nombre de la Ejecución",
"run.create.name.placeholder": "Ingresa un nombre para esta ejecución",
"run.create.name.required": "Por favor, ingresa un nombre para la ejecución",
"run.create.name.useTimestamp": "Usar la hora actual como nombre",
"run.create.openAgent": "Abrir agente en una nueva ventana",
"run.create.title": "Nueva Evaluación",
"run.create.titleWithDataset": "Nueva Evaluación en \"{{dataset}}\"",
"run.detail.agent": "Agente",
"run.detail.agent.none": "No especificado",
"run.detail.agent.unnamed": "Agente Sin Nombre",
"run.detail.backToBenchmark": "Volver al Benchmark",
"run.detail.caseResults": "Detalles de Evaluación",
"run.detail.config": "Configuración de Evaluación",
"run.detail.configSnapshot": "Instantánea de Configuración",
"run.detail.copyRunId": "Copiar ID de Ejecución",
"run.detail.copyRunIdFailed": "Error al copiar el ID de Ejecución",
"run.detail.copyRunIdSuccess": "ID de Ejecución copiado",
"run.detail.dataset": "Conjunto de Datos",
"run.detail.model": "Modelo",
"run.detail.overview": "Resumen",
"run.detail.progress": "Progreso",
"run.detail.progressCases": "casos",
"run.detail.report": "Resumen de Evaluación",
"run.edit.error": "Error al actualizar la evaluación",
"run.edit.success": "Evaluación actualizada exitosamente",
"run.edit.title": "Editar Evaluación",
"run.empty.description": "Inicia tu primera ejecución de evaluación en este conjunto de datos",
"run.empty.descriptionBenchmark": "Inicia tu primera ejecución de evaluación en este benchmark",
"run.empty.title": "Aún no hay ejecuciones",
"run.external.hint": "Ejecución completada. Esperando que el sistema externo envíe los resultados de la evaluación ...",
"run.filter.active": "Activo",
"run.filter.empty": "No hay ejecuciones que coincidan con el filtro actual.",
"run.idle.hint": "Haz clic en Iniciar para comenzar la evaluación",
"run.metrics.avgScore": "Puntaje Promedio",
"run.metrics.cost": "Costo",
"run.metrics.duration": "Duración",
"run.metrics.errorCases": "Error",
"run.metrics.evaluated": "{{count}} evaluados",
"run.metrics.passRate": "Tasa de Éxito",
"run.metrics.perCase": "/ caso",
"run.metrics.tokens": "Tokens",
"run.metrics.totalDuration": "Acumulativo",
"run.pending.hint": "La evaluación está en cola, esperando para comenzar...",
"run.running.hint": "La evaluación está en ejecución, los resultados aparecerán en breve...",
"run.status.aborted": "Abortado",
"run.status.completed": "Completado",
"run.status.completed.tooltip": "La ejecución y la puntuación externa están completas.",
"run.status.error": "Error de Ejecución",
"run.status.external": "Esperando Evaluación",
"run.status.external.tooltip": "El agente ha terminado de ejecutarse. Esperando que un sistema externo envíe los resultados de la evaluación.",
"run.status.failed": "Fallido",
"run.status.idle": "Inactivo",
"run.status.pending": "Pendiente",
"run.status.running": "En Ejecución",
"run.status.timeout": "Tiempo de Espera Excedido",
"sidebar.benchmarks": "Benchmarks",
"sidebar.dashboard": "Tablero",
"sidebar.datasets": "Conjuntos de Datos",
"sidebar.runs": "Ejecuciones",
"table.columns.avgCost": "Costo Promedio",
"table.columns.category": "Categoría",
"table.columns.cost": "Costo",
"table.columns.difficulty": "Dificultad",
"table.columns.duration": "Duración",
"table.columns.evalMode": "Modo de Evaluación",
"table.columns.expected": "Respuesta Esperada",
"table.columns.input": "Entrada",
"table.columns.score": "Puntaje",
"table.columns.status": "Estado",
"table.columns.steps": "Pasos",
"table.columns.tags": "Etiquetas",
"table.columns.tokens": "Tokens",
"table.columns.totalCost": "Costo Total",
"table.filter.all": "Todos",
"table.filter.error": "Error de Ejecución",
"table.filter.failed": "Fallido",
"table.filter.passed": "Aprobado",
"table.filter.running": "En Ejecución",
"table.search.placeholder": "Buscar casos...",
"table.total": "Total {{count}}",
"testCase.actions.add": "Agregar Caso de Prueba",
"testCase.actions.import": "Importar Casos de Prueba",
"testCase.create.advanced": "Más Opciones",
"testCase.create.difficulty.label": "Dificultad",
"testCase.create.error": "Error al agregar el caso de prueba",
"testCase.create.expected.label": "Salida Esperada",
"testCase.create.expected.placeholder": "Ingresa la respuesta esperada",
"testCase.create.expected.required": "Por favor, ingresa la salida esperada",
"testCase.create.input.label": "Entrada",
"testCase.create.input.placeholder": "Ingresa la entrada o pregunta del caso de prueba",
"testCase.create.success": "Caso de prueba agregado exitosamente",
"testCase.create.tags.label": "Etiquetas",
"testCase.create.tags.placeholder": "Etiquetas separadas por comas (opcional)",
"testCase.create.title": "Agregar Caso de Prueba",
"testCase.delete.confirm": "¿Estás seguro de que deseas eliminar este caso de prueba?",
"testCase.delete.error": "Error al eliminar el caso de prueba",
"testCase.delete.success": "Caso de prueba eliminado",
"testCase.edit.error": "Error al actualizar el caso de prueba",
"testCase.edit.success": "Caso de prueba actualizado exitosamente",
"testCase.edit.title": "Editar Caso de Prueba",
"testCase.empty.description": "Importa o agrega manualmente casos de prueba a este conjunto de datos",
"testCase.empty.title": "Aún no hay casos de prueba",
"testCase.preview.expected": "Esperado",
"testCase.preview.input": "Entrada",
"testCase.preview.title": "Vista Previa del Caso de Prueba",
"testCase.search.placeholder": "Buscar casos..."
}