etch  ] [  etch-m68k  ] [  lenny  ] [  squeeze  ] [  sid  ]
[ Source: msort  ]

Package: msort (8.52-1.1 and others)

Nástroj ke komplexnímu třídění záznamů

msort je program sloužící ke třídění souborů různými sofistikovanými způsoby. Původně byl vytvořen pro alfabetické uspořádání slovníků "exotických" jazyků, k tomu byl nakonec také intenzivně používán. Program se ale hodí k řadě dalších činností. msort se liší od klasických třídících nástrojů v tom, že je mnohem pružnější při porovnávání vstupu a záznamů a při identifikaci klíčových položek umožňuje mnohem větší kontrolu uspořádání při třídění. Hlavní vlastnosti programu jsou:

 o Msort je možno používat z příkazové řádky i skrz grafické uživatelské
   rozhraní, které se hodí nejen pro ty, kterým se zdá rozhraní příkazové
   řádky příliš složité, ale také těm, kteří se zatím nenaučili s programem
   příliš dobře pracovat.
 o Záznamy nemusí být pouze jednotlivé řádky, ale text oddělen různými
   způsoby.
 o Klíčové položky je možno určovat pomocí konkrétní pozice záznamu 
   (počítáno od začátku nebo od konce), podle rozsahu znaků (např. klíč
   se skládá z čtyř až osmi znaků), nebo podle regulárních výrazů.
 o Pro každý klíč je možno určit vlastní uspořádání. Msort také rozumí
   nastavení locales.
 o Pro každý klíč je možno definovat nekonečný počet multigrafů (sekvencí
   znaků, které je možno rozdělit do samostatných jednotek za účelem
   třídění, také se jim říká "spojovací jednotky") prakticky neomezené
   délky.
 o Oproti obvyklým lexikografickým a numerickým porovnáním, msort podporuje
   hybridní lexikografická numerická porovnání (pro takové věci jako jsou
   jména souborů a hlavičky sekcí, takže např. 2a předchází 10b), náhodná
   porovnání a uspořádání podle aktualizace, data, času, jména měsíce, jména
   domény, emailové adresy, data/času v ISO8601 a délky řetězce.
 o Čísla mohou být v libovolném číselném systému, např. čínštině nebo
   Devangari.
 o V každém klíči je možno vyloučit určitou skupinu znaků, na které se
   při třídění bere ohled a to ať už jsou na začátku, na konci nebo
   uprostřed řetězce.
 o Pro každý klíč je možno definovat množinu regulárních výrazů
   (substitucí). To umožňuje umístění takových jmen jako je např. McCarthy
   před MacCawley, neboť je McCarthy a MacCarthy vyslovován stejně a tak
   obsloužit speciální uspořádání znaků a jejich sekvence, jako známe např.
   z němčiny, kde znaménko "šarfes s" je tradičně tříděno jako kdyby tam
   bylo ss.
 o Lexikografické uspořádání je také možno otočit, to umožňuje vytváření
   reverzních slovníků.
 o Všechny klíče jsou volitelné. Uživatel může určit kolik záznamů může
   při porovnávání klíčových položek chybět.
 o Také můžet používat třídící algoritmy s různými charakteristikami.
. msort umí pracovat s UTF-8. Unicode je možno používat kdekoliv, kde se pracuje s textem: v textu, který je potřeba třídit, v definici výjimek, pro oddělovače záznamu, ve značkách pole. Je podporována kompletní sada znaků Unicode.

Domovská stránka: http://www.billposer.org/Software/msort.html

Tags: Implemented in: C, User Interface: Command Line, Role: Program, Purpose: Data Organisation, Works with: Text, Unicode

Other Packages Related to msort

  • depends
  • recommends
  • suggests
  • dep: libc0.1 (>= 2.7) [kfreebsd-amd64, kfreebsd-i386]
    Knihovna GNU C: Sdílené knihovny
    also a virtual package provided by libc0.1-udeb
  • dep: libc0.3 (>= 2.10) [hurd-i386]
    Knihovna GNU C: Sdílené knihovny
    also a virtual package provided by libc0.3-udeb
  • dep: libc6 (>= 2.5) [avr32]
    Knihovna GNU C: Sdílené knihovny
    also a virtual package provided by libc6-udeb
    dep: libc6 (>= 2.5-5) [m68k]
    dep: libc6 (>= 2.7) [not alpha, avr32, hurd-i386, ia64, kfreebsd-amd64, kfreebsd-i386, m68k]
  • dep: libc6.1 (>= 2.7) [alpha, ia64]
    Knihovna GNU C: Sdílené knihovny
    also a virtual package provided by libc6.1-udeb
  • dep: libicu38 (>= 3.8-5) [m68k]
    Package not available
  • dep: libicu42 (>= 4.2-1) [not m68k]
    International Components for Unicode
  • dep: libtre4
    regexp matching library with approximate matching
  • dep: libuninum5
    library for handling numbers as Unicode strings
  • sug: msort-gui
    TCL/TK GUI k nástroji msort

Download msort

Download for all available architectures
Architecture Version Package Size Installed Size Files
alpha 8.52-1.1 273.4 kB432 kB [list of files]
amd64 8.52-1.1 270.9 kB376 kB [list of files]
armel 8.52-1.1 265.8 kB392 kB [list of files]
avr32 (unofficial port) 8.52-1.1 267.9 kB376 kB [list of files]
hppa 8.52-1.1 272.5 kB396 kB [list of files]
hurd-i386 8.52-1.1 265.2 kB396 kB [list of files]
i386 8.52-1.1 265.1 kB396 kB [list of files]
ia64 8.52-1.1 287.7 kB508 kB [list of files]
kfreebsd-amd64 8.52-1.1 270.9 kB406 kB [list of files]
kfreebsd-i386 8.52-1.1 265.2 kB384 kB [list of files]
m68k (unofficial port) 8.52-1 261.1 kB380 kB [list of files]
mips 8.52-1.1 271.8 kB416 kB [list of files]
mipsel 8.52-1.1 270.4 kB416 kB [list of files]
powerpc 8.52-1.1 271.6 kB408 kB [list of files]
s390 8.52-1.1 270.8 kB396 kB [list of files]
sparc 8.52-1.1 268.3 kB396 kB [list of files]