Beispiel

Gibt eine beispielierte Teilmenge dieses DataFrame zurück.

Syntax

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Parameter

Parameter	Typ	Beschreibung
`withReplacement`	bool, optional	Beispiel mit Ersatz oder nicht (Standard `False`).
`fraction`	float, optional	Anteil der zu generierenden Zeilen, Bereich [0,0, 1,0].
`seed`	int, optional	Seed for sampling (default a random seed).

Rückkehr

DataFrame: Stichprobenzeilen aus einem bestimmten DataFrame.

Hinweise

Dies ist nicht gewährleistet, dass genau der Anteil angegeben ist, der der Gesamtanzahl des angegebenen DataFrames entspricht.

fraction ist erforderlich und withReplacementseed optional.

Beispiele

df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-19