evaluation – videoddd.com

December 30, 2024

[2406.18181] On the Evaluation of Large Language Models in Unit Test Generation

December 18, 2024

Lightweight AI Evaluation with SemanticKernel

December 12, 2024

How Databricks is using synthetic data to simplify evaluation of AI agents