Insight AI

Tokenisation

Vectorisation

Attention

Génération

Texte d'entrée: Le chat et le chaton jouent ensemble.

Le texte est divisé en tokens (sous-unités de texte) :

"Le"

" chat"

" et"

" le"

" chaton"

" jouent"

" ensemble"

"."

Chaque token est converti en ID numérique :

"Le"

267

" chat"

1542

" et"

389

" le"

267

" chaton"

8976

" jouent"

4523

" ensemble"

3218

"."

Outil de visualisation de tokenisation

Pour explorer comment différents textes sont tokenisés par les modèles d'OpenAI, utilisez l'outil TikTokenizer :

Copiez cette URL dans votre navigateur pour voir comment les modèles convertissent le texte en tokens.