Freigeben über


Beispiel

Gibt eine beispielierte Teilmenge dieses DataFrame zurück.

Syntax

sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)

Parameter

Parameter Typ Beschreibung
withReplacement bool, optional Beispiel mit Ersatz oder nicht (Standard False).
fraction float, optional Anteil der zu generierenden Zeilen, Bereich [0,0, 1,0].
seed int, optional Seed for sampling (default a random seed).

Rückkehr

DataFrame: Stichprobenzeilen aus einem bestimmten DataFrame.

Hinweise

Dies ist nicht gewährleistet, dass genau der Anteil angegeben ist, der der Gesamtanzahl des angegebenen DataFrames entspricht.

fraction ist erforderlich und withReplacementseed optional.

Beispiele

df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10