Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Restituisce un subset campionato di questo dataframe.
Sintassi
sample(withReplacement: Optional[Union[float, bool]] = None, fraction: Optional[Union[int, float]] = None, seed: Optional[int] = None)
Parametri
| Parametro | Tipo | Descrizione |
|---|---|---|
withReplacement |
bool, facoltativo | Esempio con sostituzione o meno (impostazione predefinita False). |
fraction |
float, facoltativo | Frazione di righe da generare, intervallo [0,0, 1,0]. |
seed |
int, facoltativo | Valore di inizializzazione per il campionamento (valore predefinito di inizializzazione casuale). |
Restituzioni
DataFrame: righe campionate da un dataframe specificato.
Note
Ciò non garantisce che fornisca esattamente la frazione specificata del conteggio totale del dataframe specificato.
fraction è obbligatorio e withReplacement sono seed facoltativi.
Examples
df = spark.range(0, 10, 1, 1)
df.sample(0.5, 3).count()
# 7
df.sample(fraction=0.5, seed=3).count()
# 4
df.sample(withReplacement=True, fraction=0.5, seed=3).count()
# 2
df.sample(1.0).count()
# 10
df.sample(fraction=1.0).count()
# 10
df.sample(False, fraction=1.0).count()
# 10