Download Source Package msort:
msort je program sloužící ke třídění souborů různými sofistikovanými způsoby. Původně byl vytvořen pro alfabetické uspořádání slovníků "exotických" jazyků, k tomu byl nakonec také intenzivně používán. Program se ale hodí k řadě dalších činností. msort se liší od klasických třídících nástrojů v tom, že je mnohem pružnější při porovnávání vstupu a záznamů a při identifikaci klíčových položek umožňuje mnohem větší kontrolu uspořádání při třídění. Hlavní vlastnosti programu jsou:
o Msort je možno používat z příkazové řádky i skrz grafické uživatelské rozhraní, které se hodí nejen pro ty, kterým se zdá rozhraní příkazové řádky příliš složité, ale také těm, kteří se zatím nenaučili s programem příliš dobře pracovat. o Záznamy nemusí být pouze jednotlivé řádky, ale text oddělen různými způsoby. o Klíčové položky je možno určovat pomocí konkrétní pozice záznamu (počítáno od začátku nebo od konce), podle rozsahu znaků (např. klíč se skládá z čtyř až osmi znaků), nebo podle regulárních výrazů. o Pro každý klíč je možno určit vlastní uspořádání. Msort také rozumí nastavení locales. o Pro každý klíč je možno definovat nekonečný počet multigrafů (sekvencí znaků, které je možno rozdělit do samostatných jednotek za účelem třídění, také se jim říká "spojovací jednotky") prakticky neomezené délky. o Oproti obvyklým lexikografickým a numerickým porovnáním, msort podporuje hybridní lexikografická numerická porovnání (pro takové věci jako jsou jména souborů a hlavičky sekcí, takže např. 2a předchází 10b), náhodná porovnání a uspořádání podle aktualizace, data, času, jména měsíce, jména domény, emailové adresy, data/času v ISO8601 a délky řetězce. o Čísla mohou být v libovolném číselném systému, např. čínštině nebo Devangari. o V každém klíči je možno vyloučit určitou skupinu znaků, na které se při třídění bere ohled a to ať už jsou na začátku, na konci nebo uprostřed řetězce. o Pro každý klíč je možno definovat množinu regulárních výrazů (substitucí). To umožňuje umístění takových jmen jako je např. McCarthy před MacCawley, neboť je McCarthy a MacCarthy vyslovován stejně a tak obsloužit speciální uspořádání znaků a jejich sekvence, jako známe např. z němčiny, kde znaménko "šarfes s" je tradičně tříděno jako kdyby tam bylo ss. o Lexikografické uspořádání je také možno otočit, to umožňuje vytváření reverzních slovníků. o Všechny klíče jsou volitelné. Uživatel může určit kolik záznamů může při porovnávání klíčových položek chybět. o Také můžet používat třídící algoritmy s různými charakteristikami.. msort umí pracovat s UTF-8. Unicode je možno používat kdekoliv, kde se pracuje s textem: v textu, který je potřeba třídit, v definici výjimek, pro oddělovače záznamu, ve značkách pole. Je podporována kompletní sada znaků Unicode.
Domovská stránka: http://www.billposer.org/Software/msort.html
|
|
|
| Architecture | Version | Package Size | Installed Size | Files |
|---|---|---|---|---|
| alpha | 8.52-1.1 | 273.4 kB | 432 kB | [list of files] |
| amd64 | 8.52-1.1 | 270.9 kB | 376 kB | [list of files] |
| armel | 8.52-1.1 | 265.8 kB | 392 kB | [list of files] |
| avr32 (unofficial port) | 8.52-1.1 | 267.9 kB | 376 kB | [list of files] |
| hppa | 8.52-1.1 | 272.5 kB | 396 kB | [list of files] |
| hurd-i386 | 8.52-1.1 | 265.2 kB | 396 kB | [list of files] |
| i386 | 8.52-1.1 | 265.1 kB | 396 kB | [list of files] |
| ia64 | 8.52-1.1 | 287.7 kB | 508 kB | [list of files] |
| kfreebsd-amd64 | 8.52-1.1 | 270.9 kB | 406 kB | [list of files] |
| kfreebsd-i386 | 8.52-1.1 | 265.2 kB | 384 kB | [list of files] |
| m68k (unofficial port) | 8.52-1 | 261.1 kB | 380 kB | [list of files] |
| mips | 8.52-1.1 | 271.8 kB | 416 kB | [list of files] |
| mipsel | 8.52-1.1 | 270.4 kB | 416 kB | [list of files] |
| powerpc | 8.52-1.1 | 271.6 kB | 408 kB | [list of files] |
| s390 | 8.52-1.1 | 270.8 kB | 396 kB | [list of files] |
| sparc | 8.52-1.1 | 268.3 kB | 396 kB | [list of files] |