Section 11

Évaluation de modèles

Évaluation rigoureuse des LLM avec des métriques comme BLEU, ROUGE et la perplexité.

Projets dans cette section: 0

Évaluation de modèlesGitHub

Évaluation des performances LLM avec BLEU et ROUGE.

Évaluation de modèlesGitHub

Benchmark comparatif de résumé entre T5 et GPT-2.