Pacote: ucto (0.21.1-2 e outros)
Links para ucto
Recursos de Debian:
- Relatórios de bug
- Informação de desenvolvedor(a)
- Debian Changelog
- Arquivo de copyright
- Rastreador de patch Debian
Baixe o pacote-fonte ucto:
Mantenedores(as):
- Debian Science Team (QA Página, E-mail Arquivo)
- Maarten van Gompel (QA Página)
- Ko van der Sloot (QA Página)
Fontes externas:
- Pagina principal [languagemachines.github.io]
Pacotes similares:
tokenizador Unicode
Ucto pode tokenizar arquivos de texto codificados em UTF-8 (ou seja, separar as palavras da pontuação, dividir sentenças, gerar n-gramas) e oferece vários outros passos básicos de pré-processamento que deixam seu texto pronto para processamento posterior, como indexação, etiquetagem de partes de fala ou tradução de máquina.
Este pacote fornece a ferramenta de linha de comando em si.
Ucto foi escrito por Maarten van Gompel e Ko van der Sloot. O trabalho no Ucto foi financiado pela NWO, a Organização Holandesa para Pesquisa Científica, sob o projeto Implicit Linguistics, o programa CLARIN-NL e o projeto CLARIAH.
Ucto é um produto do Centro de Tecnologia de Linguagem e Fala (Universidade Radboud Nijmegen) e anteriormente pelo Grupo de Pesquisa ILK (Universidade Tilburg, Holanda).
Se você tiver interesse em análise de máquina de arquivos texto codificados em UTF-8, por exemplo para fazer pesquisa científica em processamento de língua natural, o ucto vai ser útil para você.
Outros pacotes relacionados a ucto
|
|
|
|
-
- dep: libc6 (>= 2.14) [amd64]
- GNU Biblioteca C: Bibliotecas compartilhadas
também um pacote virtual fornecido por libc6-udeb
- dep: libc6 (>= 2.17) [arm64]
- dep: libc6 (>= 2.4) [armhf, i386]
-
- dep: libfolia14 (>= 2.4)
- Implementation of the FoLiA document format
-
- dep: libgcc-s1 (>= 3.0) [não armhf]
- Biblioteca de suporte GCC
- dep: libgcc-s1 (>= 3.5) [armhf]
-
- dep: libicu67 (>= 67.1-1~)
- componentes internacionais para Unicode
-
- dep: libstdc++6 (>= 5.2)
- Biblioteca C++ padrão da GNU v3
-
- dep: libticcutils8 (>= 0.24)
- utility functions used in the context of Natural Language Processing (library)
-
- dep: libucto5 (>= 0.21.1)
- Unicode Tokenizer - runtime
-
- dep: uctodata
- Data files for Ucto
Download de ucto
Arquitetura | Versão | Tamanho do pacote | Tamanho instalado | Arquivos |
---|---|---|---|---|
amd64 | 0.21.1-2+b1 | 57.0 kB | 117.0 kB | [lista de arquivos] |
arm64 | 0.21.1-2+b1 | 55.8 kB | 109.0 kB | [lista de arquivos] |
armhf | 0.21.1-2+b1 | 55.3 kB | 96.0 kB | [lista de arquivos] |
i386 | 0.21.1-2+b1 | 57.9 kB | 116.0 kB | [lista de arquivos] |