Este programa extrai textos de arquivos do MS-Word, tentando preservar os muitos caracteres especiais que são imprimíveis. catdoc suporta tudo até o Word-97. Também suporta documentos do MS Write e arquivos RTF.
Ele não tenta preservar a formatação do Word, porque os usuários do Word geralmente não se preocupam com a estrutura do texto, e isso é uma das coisas mais importantes para quem é usuário do LaTeX.
Também é fornecida a xls2csv, que extrai dados de planilhas de Excel e mostra as informações separadas por vírgula, e o catppt que extrai dados de apresentações do PowerPoint.
Este pacote sugere o tk porque ele também inclui o wordview, uma interface gráfica em tk opcional para o catdoc. O config MIME fornecido neste pacote vai usar o wordview se o X estiver funcionando, ou catdoc se não estiver.
Página na Internet : http://freshmeat.net/projects/catdoc
|
|
|
| Architecture | Package Size | Installed Size | Files |
|---|---|---|---|
| amd64 | 630.0 kB | 2664 kB | [list of files] |
| armel | 620.6 kB | 2648 kB | [list of files] |
| hppa | 595.6 kB | 2664 kB | [list of files] |
| i386 | 580.6 kB | 2648 kB | [list of files] |
| ia64 | 621.9 kB | 2764 kB | [list of files] |
| mips | 600.1 kB | 2688 kB | [list of files] |
| mipsel | 600.0 kB | 2688 kB | [list of files] |
| powerpc | 587.5 kB | 2648 kB | [list of files] |
| s390 | 591.3 kB | 2656 kB | [list of files] |
| sparc | 580.5 kB | 2648 kB | [list of files] |