all options
bullseye  ] [  bookworm  ] [  trixie  ] [  forky  ] [  sid  ]
[ Source: ucto  ]

Package: ucto (0.35-2 and others)

Links for ucto

Screenshot

Debian Resources:

Download Source Package ucto:

Maintainers:

External Resources:

Similar packages:

suddivisione in token per Unicode

Ucto può suddividere in token file di testo in codifica UTF-8 (cioè separare parole dalla punteggiatura, suddividere frasi, generare n-grammi) e offre svariati altri passi di preelaborazione di base che rendono il testo adatto ad un'ulteriore elaborazione come indicizzazione, etichettatura di parti del discorso o traduzione automatica.

Questo pacchetto fornisce lo strumento a riga di comando vero e proprio.

Ucto è stato scritto da Maarten van Gompel e Ko van der Sloot. Il lavoro su Ucto è stato finanziato dalla NWO, la Netherlands Organisation for Scientific Research, come parte del progetto Implicit Linguistics, del programma CLARIN-NL e del progetto CLARIAH.

Ucto è un prodotto del Centre of Language and Speech Technology (Radboud University Nijmegen), e in precedenza dell'ILK Research Group (Tilburg University, Paesi Bassi).

Se si è interessati nell'analisi automatica di file di testo in codifica UTF-8, ad esempio per fare ricerca scientifica nel campo dell'elaborazione del linguaggio naturale, ucto sarà probabilmente utile.

Tags: Implemented in: C++, Role: Program

Other Packages Related to ucto

  • depends
  • recommends
  • suggests
  • enhances

Download ucto

Download for all available architectures
Architecture Version Package Size Installed Size Files
alpha (unofficial port) 0.35-2+b1 29.7 kB156.0 kB [list of files]
amd64 0.35-2+b1 32.8 kB112.0 kB [list of files]
arm64 0.35-2+b1 28.8 kB156.0 kB [list of files]
armel 0.35-2+b1 29.9 kB154.0 kB [list of files]
armhf 0.35-2+b1 30.1 kB91.0 kB [list of files]
hppa (unofficial port) 0.35-2+b1 29.5 kB92.0 kB [list of files]
i386 0.35-2+b1 34.2 kB110.0 kB [list of files]
ia64 (unofficial port) 0.21.1-2.1+b1 57.0 kB144.0 kB [list of files]
loong64 (unofficial port) 0.35-2+b1 29.3 kB155.0 kB [list of files]
m68k (unofficial port) 0.35-2+b1 30.0 kB106.0 kB [list of files]
mips64el 0.35-2+b1 29.4 kB157.0 kB [list of files]
ppc64 (unofficial port) 0.35-2+b1 30.4 kB157.0 kB [list of files]
ppc64el 0.35-2+b1 30.5 kB155.0 kB [list of files]
riscv64 0.35-2+b1 30.0 kB88.0 kB [list of files]
s390x 0.35-2+b1 31.4 kB103.0 kB [list of files]
sh4 (unofficial port) 0.35-2+b1 32.2 kB90.0 kB [list of files]
sparc64 (unofficial port) 0.35-2+b1 26.7 kB1,054.0 kB [list of files]
x32 (unofficial port) 0.35-2+b1 32.3 kB103.0 kB [list of files]