Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt einen neuen DataFrame Wert zurück, in dem Nullwerte mit einem neuen Wert gefüllt werden.
DataFrame.fillna und DataFrameNaFunctions.fill sind Aliase voneinander.
Syntax
fill(value, subset=None)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
value |
int, float, str, bool, or dict | Der Wert, durch den Nullwerte ersetzt werden sollen. Wenn ein Diktat bereitgestellt wird, subset wird es ignoriert und value muss eine Zuordnung von Spaltennamen zu Ersetzungswert sein. Ersetzungswerte müssen int, float, bool oder str sein. |
subset |
str, tupel oder liste, optional | Zu berücksichtigende Spaltennamen. Spalten, für subsetvalue die kein übereinstimmener Datentyp vorhanden ist, werden ignoriert. |
Rückkehr
DataFrame
Beispiele
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
Füllen Sie alle Nullwerte mit 50 für numerische Spalten aus.
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
Füllen Sie alle Nullwerte für False boolesche Spalten aus.
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
Füllen Sie Nullwerte mit 50 für age und "unknown" für name.
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+
Füllen Sie alle Nullwerte "Spark" für die name Spalte aus.
df.na.fill(value='Spark', subset='name').show()
# +----+------+-----+----+
# | age|height| name|bool|
# +----+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| NULL| Bob|NULL|
# |NULL| NULL| Tom|NULL|
# |NULL| NULL|Spark|true|
# +----+------+-----+----+