Skip to main

Vocabulaire du traitement automatique des langues (POC)

Search from vocabulary

Concept information

Término preferido

token  

Definición

  • Élément de base de l'annotation textuelle qui ne peut être découpé en unités plus petites, et peut ainsi être constitué de plusieurs mots graphiques, comme c’est le cas par exemple des expressions idiomatiques, des mots composés ou de certains nombres. (Adapté de Bernhard et al., Problèmes de tokénisation pour deux langues régionales de France, l’alsacien et le picard, 2018, et https://www.linguist.univ-paris-diderot.fr/~amsili/Ens21/pdf/slides-l1hn001-03.pdf)

Concepto genérico

Conceptos específicos

En otras lenguas

URI

http://data.loterre.fr/ark:/67375/8LP-TX1JH6ZL-6

Descargue este concepto:

RDF/XML TURTLE JSON-LD última modificación 14/6/24