Section 14

Architectures Transformers

Exploration des internals des modèles : construction des mécanismes d’attention multi-tête depuis zéro.

Projets dans cette section: 0

Architectures TransformersGitHub

Construction du mécanisme d'attention, tenseur par tenseur.

Architectures TransformersGitHub

Modèle de langage Transformer complet, construit from scratch.