all options
buster  ]
[ Source: ucto  ]

Package: libucto3 (0.14-2)

Links for libucto3

Screenshot

Debian Resources:

Download Source Package ucto:

Maintainers:

External Resources:

Similar packages:

suddivisione in token per Unicode - runtime

Ucto può suddividere in token file di testo in codifica UTF-8 (cioè separare parole dalla punteggiatura, suddividere frasi, generare n-grammi) e offre svariati altri passi di preelaborazione di base che rendono il testo adatto ad un'ulteriore elaborazione come indicizzazione, etichettatura di parti del discorso o traduzione automatica.

Questo pacchetto fornisce solamente la libreria di programmazione.

Ucto è stato scritto da Maarten van Gompel e Ko van der Sloot. Il lavoro su Ucto è stato finanziato dalla NWO, la Netherlands Organisation for Scientific Research, come parte del progetto Implicit Linguistics, del programma CLARIN-NL e del progetto CLARIAH.

Ucto è un prodotto del Centre of Language and Speech Technology (Radboud University Nijmegen), e in precedenza dell'ILK Research Group (Tilburg University, Paesi Bassi).

Se si è interessati nell'analisi automatica di file di testo in codifica UTF-8, ad esempio per fare ricerca scientifica nel campo dell'elaborazione del linguaggio naturale, ucto sarà probabilmente utile.

Other Packages Related to libucto3

  • depends
  • recommends
  • suggests
  • enhances

Download libucto3

Download for all available architectures
Architecture Package Size Installed Size Files
amd64 132.0 kB533.0 kB [list of files]
arm64 123.0 kB518.0 kB [list of files]
armhf 118.0 kB324.0 kB [list of files]
i386 142.6 kB443.0 kB [list of files]