etch  ] [  etch-m68k  ] [  lenny  ] [  sid  ]
[ Source: msort  ]

Package: msort (8.44-1)

Nástroj ke komplexnímu třídění záznamů

msort je program sloužící ke třídění souborů různými sofistikovanými způsoby. Původně byl vytvořen pro alfabetické uspořádání slovníků "exotických" jazyků, k tomu byl nakonec také intenzivně používán. Program se ale hodí k řadě dalších činností. msort se liší od klasických třídících nástrojů v tom, že je mnohem pružnější při porovnávání vstupu a záznamů a při identifikaci klíčových položek umožňuje mnohem větší kontrolu uspořádání při třídění. Hlavní vlastnosti programu jsou:

 o Msort je možno používat z příkazové řádky i skrz grafické uživatelské
   rozhraní, které se hodí nejen pro ty, kterým se zdá rozhraní příkazové
   řádky příliš složité, ale také těm, kteří se zatím nenaučili s programem
   příliš dobře pracovat.
 o Záznamy nemusí být pouze jednotlivé řádky, ale text oddělen různými
   způsoby.
 o Klíčové položky je možno určovat pomocí konkrétní pozice záznamu 
   (počítáno od začátku nebo od konce), podle rozsahu znaků (např. klíč
   se skládá z čtyř až osmi znaků), nebo podle regulárních výrazů.
 o Pro každý klíč je možno určit vlastní uspořádání. Msort také rozumí
   nastavení locales.
 o Pro každý klíč je možno definovat nekonečný počet multigrafů (sekvencí
   znaků, které je možno rozdělit do samostatných jednotek za účelem
   třídění, také se jim říká "spojovací jednotky") prakticky neomezené
   délky.
 o Oproti obvyklým lexikografickým a numerickým porovnáním, msort podporuje
   hybridní lexikografická numerická porovnání (pro takové věci jako jsou
   jména souborů a hlavičky sekcí, takže např. 2a předchází 10b), náhodná
   porovnání a uspořádání podle aktualizace, data, času, jména měsíce, jména
   domény, emailové adresy, data/času v ISO8601 a délky řetězce.
 o Čísla mohou být v libovolném číselném systému, např. čínštině nebo
   Devangari.
 o V každém klíči je možno vyloučit určitou skupinu znaků, na které se
   při třídění bere ohled a to ať už jsou na začátku, na konci nebo
   uprostřed řetězce.
 o Pro každý klíč je možno definovat množinu regulárních výrazů
   (substitucí). To umožňuje umístění takových jmen jako je např. McCarthy
   před MacCawley, neboť je McCarthy a MacCarthy vyslovován stejně a tak
   obsloužit speciální uspořádání znaků a jejich sekvence, jako známe např.
   z němčiny, kde znaménko "šarfes s" je tradičně tříděno jako kdyby tam
   bylo ss.
 o Lexikografické uspořádání je také možno otočit, to umožňuje vytváření
   reverzních slovníků.
 o Všechny klíče jsou volitelné. Uživatel může určit kolik záznamů může
   při porovnávání klíčových položek chybět.
 o Také můžet používat třídící algoritmy s různými charakteristikami.
. msort umí pracovat s UTF-8. Unicode je možno používat kdekoliv, kde se pracuje s textem: v textu, který je potřeba třídit, v definici výjimek, pro oddělovače záznamu, ve značkách pole. Je podporována kompletní sada znaků Unicode.

Domovská stránka: http://www.billposer.org/Software/msort.html

Tags: Implemented in: C, User Interface: Command Line, Role: Program, Purpose: Data Organisation, Works with: Text, Unicode

Other Packages Related to msort

  • depends
  • recommends
  • suggests
  • dep: libc6 (>= 2.7-1) [not alpha, ia64]
    Knihovna GNU C: Sdílené knihovny
    also a virtual package provided by libc6-udeb
  • dep: libc6.1 (>= 2.7-1) [alpha, ia64]
    Knihovna GNU C: Sdílené knihovny
    also a virtual package provided by libc6.1-udeb
  • dep: libgmp3c2
    Multiprecision arithmetic library
  • dep: libicu38 (>= 3.8-5)
    International Components for Unicode
  • dep: libtre4
    regexp matching library with approximate matching
  • dep: libuninum5
    library for handling numbers as Unicode strings
  • sug: msort-gui
    TCL/TK GUI k nástroji msort

Download msort

Download for all available architectures
Architecture Package Size Installed Size Files
alpha 220.2 kB380 kB [list of files]
amd64 217.0 kB360 kB [list of files]
arm 213.3 kB340 kB [list of files]
armel 212.7 kB336 kB [list of files]
hppa 219.2 kB344 kB [list of files]
i386 211.7 kB340 kB [list of files]
ia64 234.6 kB456 kB [list of files]
mips 219.2 kB364 kB [list of files]
mipsel 217.1 kB364 kB [list of files]
powerpc 219.7 kB356 kB [list of files]
s390 217.1 kB340 kB [list of files]
sparc 214.9 kB344 kB [list of files]