wszystkie opcje
wheezy  ] [  jessie  ] [  stretch  ] [  buster  ] [  sid  ]
[ Pakiet źródłowy: ucto  ]

Pakiet: ucto (0.5.2-2)

Odnośniki dla ucto

Screenshot

Zasoby systemu Debian:

Pobieranie pakietu źródłowego ucto:

Opiekunowie:

Zasoby zewnętrzne:

Podobne pakiety:

Unicode Tokenizer

Ucto can tokenize UTF-8 encoded text files (i.e. separate words from punctuation, split sentences, generate n-grams), and offers several other basic preprocessing steps (change case, count words/characters and reverse lines) that make your text suited for further processing such as indexing, part-of-speech tagging, or machine translation.

Ucto is a product of the ILK Research Group, Tilburg University (The Netherlands).

If you are interested in machine parsing of UTF-8 encoded text files, e.g. to do scientific research in natural language processing, ucto will likely be of use to you.

Znaczniki: Zaimplementowane w: C++, Rola: Program

Inne pakiety związane z ucto

  • wymaga
  • poleca
  • sugeruje
  • enhances

Pobieranie ucto

Pobierz dla wszystkich dostępnych architektur
Architektura Rozmiar pakietu Rozmiar po instalacji Pliki
amd64 36,7 KiB153,0 KiB [lista plików]