Évaluation de modèlesGitHub
LLM Metrics (BLEU/ROUGE)
Évaluation des performances LLM avec BLEU et ROUGE.
Évaluation rigoureuse des LLM avec des métriques comme BLEU, ROUGE et la perplexité.
Projets dans cette section: 0
Évaluation des performances LLM avec BLEU et ROUGE.
Benchmark comparatif de résumé entre T5 et GPT-2.