HumanEval: A Benchmark for Evaluating LLM Code Generation Capabilities

Writing about LLMs

Learn how to evaluate your LLM on code generation capabilities with the Hugging Face Evaluate library.