langsmith-evaluator

Construye pipelines de evaluación para LangSmith con LLM-as-Judge y evaluadores de código personalizados. Tres componentes principales: crear evaluadores (LLM-as-Judge o código personalizado), definir funciones de ejecución para capturar salidas y trayectorias del agente, y ejecutar evaluaciones localmente o mediante ejecución automática a través de evaluadores cargados. Admite tanto evaluadores offline (comparando salidas de ejecución con ejemplos del dataset) como evaluadores online (verificaciones de calidad en tiempo real sobre ejecuciones en producción). Requiere clave API de LangSmith y proyecto...

npx skills add https://github.com/langchain-ai/langsmith-skills --skill langsmith-evaluator

Más skills de langchain-ai

arxiv-search
langchain-ai
Busca en arXiv prepublicaciones y artículos académicos por tema con recuperación de resúmenes. Búsqueda basada en consultas en física, matemáticas, ciencias de la computación, biología, estadística y campos relacionados. Límite de resultados configurable (por defecto 10 artículos) con resultados ordenados por relevancia. Devuelve título y resumen de cada artículo coincidente. Requiere el paquete arxiv de Python; instálelo mediante pip si aún no está presente.
official
blog-post
langchain-ai
Redacción de publicaciones de blog de formato largo con delegación de investigación, plantillas de contenido estructurado e imágenes de portada generadas por IA. Delega la investigación a subagentes antes de escribir, almacenando los hallazgos en markdown para referencia y contexto. Aplica una estructura de publicación de cinco partes: gancho, contexto, contenido principal (3–5 secciones), aplicación práctica y conclusión con llamado a la acción. Genera imágenes de portada optimizadas para SEO utilizando indicaciones detalladas que cubren tema, estilo, composición, color e iluminación. Genera publicaciones para...
official
code-review
langchain-ai
Realizar una revisión estructurada de código de los cambios, verificando corrección, estilo, pruebas y posibles problemas.
official
coding-prefs
langchain-ai
Lee las preferencias de codificación del usuario desde /memory/coding-prefs.md antes de tomar decisiones de estilo no triviales, y agrega nuevas preferencias cuando el usuario las proporcione…
official
competitor-analysis
langchain-ai
Cuando se le pide analizar competidores:
official
cudf-analytics
langchain-ai
Útil para análisis de datos acelerados por GPU en conjuntos de datos, archivos CSV o datos tabulares utilizando NVIDIA cuDF. Se activa cuando las tareas implican agregaciones groupby, estadísticas…
official
cuml-machine-learning
langchain-ai
Útil para aprendizaje automático acelerado por GPU en datos tabulares usando NVIDIA cuML. Se activa cuando las tareas implican clasificación, regresión, agrupamiento, reducción de dimensionalidad…
official
data-visualization
langchain-ai
Úsalo para crear gráficos de calidad de publicación y resúmenes de análisis de múltiples paneles. Se activa cuando las tareas implican visualizar datos, trazar resultados, crear…
official