Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gibt eine beispielierte Teilmenge dieses DataFrame zurück.
Syntax
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
withReplacement |
bool, optional | Beispiel mit Ersatz oder nicht (Standard False). |
fraction |
float, optional | Anteil der zu generierenden Zeilen, Bereich [0,0, 1,0]. |
seed |
int, optional | Seed for sampling (default a random seed). |
Rückkehr
DataFrame: Stichprobenzeilen aus einem bestimmten DataFrame.
Hinweise
Dies ist nicht gewährleistet, dass genau der Anteil angegeben ist, der der Gesamtanzahl des angegebenen DataFrames entspricht.
fraction ist erforderlich und withReplacementseed optional.
Beispiele
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10