Skip to content

Conversation

@WHQAQ11
Copy link
Contributor

@WHQAQ11 WHQAQ11 commented Nov 1, 2025

新增文件:

  • 10_Universal_llm_judge.py: 展示使用 UniversalLLMJudgeEvaluator 进行代码质量评估的案例,包含自定义代码模板
  • 11_Universal_win_rate.py: 展示使用 UniversalWinRateEvaluator 对比生成数学题和参考题质量的案例

文档更新:

  • 更新第12章文档:在12.4.9节 添加 Universal LLMJudge 和 Universal Win Rate 模块的完整使用指南,包括两层级 API 设计、内置模板详解、自定义维度创建、字段映射最佳实践等内容

这些改进展示了通用模块字段映射和自定义评估维度的用法。

  新增文件:
  - 10_Universal_llm_judge.py: 展示使用 UniversalLLMJudgeEvaluator 进行代码质量评估的案例,包含自定义代码模板
  - 11_Universal_win_rate.py: 展示使用 UniversalWinRateEvaluator 对比生成数学题和参考题质量的案例

  文档更新:
  - 更新第12章文档:添加 Universal LLMJudge 和 Win Rate 模块的完整使用指南,包括两层级 API
  设计、内置模板详解、自定义维度创建、字段映射最佳实践等内容

  这些改进展示了通用模块字段映射和自定义评估维度的用法。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant