Retour au portfolio
Section 11

Évaluation de modèles

Évaluation rigoureuse des LLM avec des métriques comme BLEU, ROUGE et la perplexité.

Projets dans cette section: 0

LLM Metrics (BLEU/ROUGE)
Évaluation de modèlesGitHub

LLM Metrics (BLEU/ROUGE)

Évaluation des performances LLM avec BLEU et ROUGE.

Summarization Benchmark
Évaluation de modèlesGitHub

Summarization Benchmark

Benchmark comparatif de résumé entre T5 et GPT-2.