Download Source Package msort:
msort je program sloužící ke třídění souborů různými sofistikovanými způsoby. Původně byl vytvořen pro alfabetické uspořádání slovníků "exotických" jazyků, k tomu byl nakonec také intenzivně používán. Program se ale hodí k řadě dalších činností. msort se liší od klasických třídících nástrojů v tom, že je mnohem pružnější při porovnávání vstupu a záznamů a při identifikaci klíčových položek umožňuje mnohem větší kontrolu uspořádání při třídění. Hlavní vlastnosti programu jsou:
o Msort je možno používat z příkazové řádky i skrz grafické uživatelské rozhraní, které se hodí nejen pro ty, kterým se zdá rozhraní příkazové řádky příliš složité, ale také těm, kteří se zatím nenaučili s programem příliš dobře pracovat. o Záznamy nemusí být pouze jednotlivé řádky, ale text oddělen různými způsoby. o Klíčové položky je možno určovat pomocí konkrétní pozice záznamu (počítáno od začátku nebo od konce), podle rozsahu znaků (např. klíč se skládá z čtyř až osmi znaků), nebo podle regulárních výrazů. o Pro každý klíč je možno určit vlastní uspořádání. Msort také rozumí nastavení locales. o Pro každý klíč je možno definovat nekonečný počet multigrafů (sekvencí znaků, které je možno rozdělit do samostatných jednotek za účelem třídění, také se jim říká "spojovací jednotky") prakticky neomezené délky. o Oproti obvyklým lexikografickým a numerickým porovnáním, msort podporuje hybridní lexikografická numerická porovnání (pro takové věci jako jsou jména souborů a hlavičky sekcí, takže např. 2a předchází 10b), náhodná porovnání a uspořádání podle aktualizace, data, času, jména měsíce, jména domény, emailové adresy, data/času v ISO8601 a délky řetězce. o Čísla mohou být v libovolném číselném systému, např. čínštině nebo Devangari. o V každém klíči je možno vyloučit určitou skupinu znaků, na které se při třídění bere ohled a to ať už jsou na začátku, na konci nebo uprostřed řetězce. o Pro každý klíč je možno definovat množinu regulárních výrazů (substitucí). To umožňuje umístění takových jmen jako je např. McCarthy před MacCawley, neboť je McCarthy a MacCarthy vyslovován stejně a tak obsloužit speciální uspořádání znaků a jejich sekvence, jako známe např. z němčiny, kde znaménko "šarfes s" je tradičně tříděno jako kdyby tam bylo ss. o Lexikografické uspořádání je také možno otočit, to umožňuje vytváření reverzních slovníků. o Všechny klíče jsou volitelné. Uživatel může určit kolik záznamů může při porovnávání klíčových položek chybět. o Také můžet používat třídící algoritmy s různými charakteristikami.. msort umí pracovat s UTF-8. Unicode je možno používat kdekoliv, kde se pracuje s textem: v textu, který je potřeba třídit, v definici výjimek, pro oddělovače záznamu, ve značkách pole. Je podporována kompletní sada znaků Unicode.
Domovská stránka: http://www.billposer.org/Software/msort.html
|
|
|
| Architecture | Package Size | Installed Size | Files |
|---|---|---|---|
| alpha | 220.2 kB | 380 kB | [list of files] |
| amd64 | 217.0 kB | 360 kB | [list of files] |
| arm | 213.3 kB | 340 kB | [list of files] |
| armel | 212.7 kB | 336 kB | [list of files] |
| hppa | 219.2 kB | 344 kB | [list of files] |
| i386 | 211.7 kB | 340 kB | [list of files] |
| ia64 | 234.6 kB | 456 kB | [list of files] |
| mips | 219.2 kB | 364 kB | [list of files] |
| mipsel | 217.1 kB | 364 kB | [list of files] |
| powerpc | 219.7 kB | 356 kB | [list of files] |
| s390 | 217.1 kB | 340 kB | [list of files] |
| sparc | 214.9 kB | 344 kB | [list of files] |