etch  ] [  etch-m68k  ] [  lenny  ] [  sid  ]
[ Quellcode: msort  ]

Paket: msort (8.44-1)

Programm um Datensätze auf komplexe Arten zu sortieren

msort ist ein Programm, um Dateien auf raffinierte Arten zu sortieren. Es wurde ursprünglich entwickelt, um Wörterbücher "exotischer" Sprachen alphabetisch zu ordnen, wofür es auch ausgiebig verwendet wurde, aber es ist auch für viele andere Zwecke nützlich. msort unterscheidet sich von herkömmlichen Sortier-Programmen durch größere Flexibilität beim Einlesen der Eingabe in Datensätze, Erkennen von Schlüssel-Feldern und bessere Kontrolle über die Sortier-Reihenfolge. Seine vielen besonderen Fähigkeiten sind:

 o Msort kann als Befehlszeilenprogramm oder über eine grafische
   Benutzeroberfläche verwendet werden. Dies hilft nicht nur denen, die
   eine komplizierte Befehlszeile für zu umständlich erachten, sondern
   auch denen, die mit den Einzelheiten des Sortierens nicht vertraut
   sind.
 o Datensätze müssen nicht aus einer einzelnen Zeile Text bestehen,
   sondern können auf verschiedene Arten getrennt werden.
 o Schlüssel-Felder können durch ihre Position im Datensatz (vom Anfang
   oder vom Ende aus gezählt) ausgewählt werden, durch Zeichen-Bereiche
   (z. B. besteht der Schlüssel aus dem vierten bis zum achten Zeichen),
   oder durch das Abgleichen eines regulären Ausdrucks mit einer
   Markierung.
 o Für jeden Schlüssel kann eine beliebige Sortier-Reihenfolge festgelegt
   werden. Msort versteht außerdem Locales.
 o Für jeden Schlüssel kann eine praktisch unbeschränkte Anzahl von
Multigraphen (Folgen von Zeichen, die zum Sortieren als Einheit betrachtet werden sollen, "zusammenfallende Elemente" in Unicode-Sprache) von unbegrenzter Länge festgelegt werden.
 o Zusätzlich zu den gewöhnlichen lexikographischen und numerischen
Vergleichen, unterstützt msort hybride lexikographisch-numerische Vergleiche (für Dinge wie Dateinamen oder Teilüberschriften, so dass z. B. 2a der 10b vorausgeht), Zufallsvergleiche, und ordnen nach Winkel, Datum, Zeit, Monatsname, Domain-Name, E-Mail-Adresse, ISO8601 Datum/Zeit und Text-Länge.
 o Zahlen können in so gut wie jedem Zahlensystem stehen, z. B. Chinesisch
oder Devanagari.
 o Für jeden Schlüssel kann eine bestimmte Menge von Zeichen (in
irgendeiner Kombination aus den Positionen Anfang, Ende und Mitte des Schlüssel-Feldes) vom Sortiervorgang ausgeschlossen werden.
 o Für jeden Schlüssel kann eine eigene Menge von regulären Ausdrücken
und deren Ersetzungen definiert werden. Diese stellen Mittel bereit, um Namen wie McCarthy vor MacCawley zu sortieren, als wäre McCarthy als MacCarthy geschrieben. Ebenso können seltene Fälle gehandhabt werden, wo ein einzelner Buchstabe wie eine Zeichenfolge sortiert werden soll, wie beim deutschen "ß" welches für gewöhnlich als "ss" einsortiert wird.
 o Lexikographische Schlüssel können umgekehrt werden, wodurch rückwärts
   sortierte Wörterbücher möglich werden.
 o Irgendwelche oder alle Schlüssel können optional sein. Für optionale
Schlüssel kann der Benutzer festlegen, wie Datensätze mit fehlenden Feldern im Vergleich zu Datensätzen, in denen das Feld verfügbar ist, einsortiert werden sollen.
 o Eine Auswahl verschiedener Sortier-Algorithmen mit unterschiedlichen
Eigenschaften wird bereitgestellt.

msort versteht UTF-8 Unicode. Unicode kann überall verwendet werden, wo Text eingegeben wird: im zu sortierenden Text, in der Sortierreihenfolge und Auschluss-Definitionen, als Feld- oder Datensatz-Trenner oder als Feld-Markierung. Vollständige Unicode-Groß-Klein-Umwandlung ist verfügbar.

Markierungen: Implementiert in: C, Benutzer-Schnittstellen: Kommandozeile, Rolle: Programm, Zweck: Daten-Organisation, Arbeitet mit: Text, Unicode

Andere Pakete mit Bezug zu msort

  • hängt ab von
  • empfiehlt
  • schlägt vor
  • dep: libc6 (>= 2.7-1) [nicht alpha, ia64]
    GNU C-Bibliothek: Dynamische Bibliotheken
    auch ein virtuelles Paket, bereitgestellt durch libc6-udeb
  • dep: libc6.1 (>= 2.7-1) [alpha, ia64]
    GNU C-Bibliothek: Dynamische Bibliotheken
    auch ein virtuelles Paket, bereitgestellt durch libc6.1-udeb
  • dep: libgmp3c2
    Mehrfachgenaue, arithmetische Bibliothek
  • dep: libicu38 (>= 3.8-5)
    International Components for Unicode
  • dep: libtre4
    regexp matching library with approximate matching
  • dep: libuninum5
    library for handling numbers as Unicode strings
  • sug: msort-gui
    tcl/tk-Oberfläche für das msort-Programm

msort herunterladen

Download für alle verfügbaren Architekturen
Architektur Paketgröße Größe (installiert) Dateien
alpha 220,2 kB380 kB [Liste der Dateien]
amd64 217,0 kB360 kB [Liste der Dateien]
arm 213,3 kB340 kB [Liste der Dateien]
armel 212,7 kB336 kB [Liste der Dateien]
hppa 219,2 kB344 kB [Liste der Dateien]
i386 211,7 kB340 kB [Liste der Dateien]
ia64 234,6 kB456 kB [Liste der Dateien]
mips 219,2 kB364 kB [Liste der Dateien]
mipsel 217,1 kB364 kB [Liste der Dateien]
powerpc 219,7 kB356 kB [Liste der Dateien]
s390 217,1 kB340 kB [Liste der Dateien]
sparc 214,9 kB344 kB [Liste der Dateien]