Freigeben über


sort

Gibt einen neuen DataFrame zurück, der nach den angegebenen Spalten sortiert ist.

Syntax

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parameter

Parameter Typ Beschreibung
cols int, str, list oder Column, optional Liste der Spalten- oder Spaltennamen oder Spalten-Ordnungszahlen, nach der sortiert werden soll.
ascending bool or list, optional, default True Boolescher Wert oder eine boolesche Liste. Aufsteigend und absteigend sortieren. Geben Sie die Liste für mehrere Sortierreihenfolgen an. Wenn eine Liste angegeben ist, muss die Länge der Liste die Länge der cols.

Rückkehr

DataFrame: Sortiertes DataFrame.

Hinweise

Eine Spalten-Ordnungszahl beginnt von 1, die sich von der 0-basierten __getitem__unterscheidet. Wenn ein Spalten-Ordinal negativ ist, bedeutet dies, absteigend zu sortieren.

Beispiele

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+