Condividi tramite


jdbc (DataFrameReader)

Costruisce un oggetto DataFrame che rappresenta la tabella di database accessibile tramite l'URL urlJDBC. Le partizioni della tabella vengono recuperate in parallelo se column si specifica o predicates . Se vengono specificati e columnpredicates , column ha la precedenza.

Sintassi

jdbc(url, table, column=None, lowerBound=None, upperBound=None,
     numPartitions=None, predicates=None, properties=None)

Parametri

Parametro Tipo Descrizione
url str URL JDBC del formato jdbc:subprotocol:subname.
table str Nome della tabella nel database esterno.
column str, facoltativo Colonna da usare per il partizionamento (alias per l'opzione partitionColumn ). Richiede lowerBound, upperBounde numPartitions.
lowerBound int o str, facoltativo Valore minimo di column per il partizionamento. Obbligatorio quando column viene specificato.
upperBound int o str, facoltativo Valore massimo di column per il partizionamento. Obbligatorio quando column viene specificato.
numPartitions int, facoltativo Numero di partizioni. Obbligatorio quando column viene specificato.
predicates list, facoltativo Elenco di espressioni di WHERE clausola, ognuna che definisce una partizione di DataFrame. Ignorato se column è specificato.
properties dict, facoltativo Argomenti di connessione JDBC, in genere inclusi 'user' e 'password'. Ad esempio: {'user': 'SYSTEM', 'password': 'mypassword'}.

Restituzioni

DataFrame

Note

Evitare di creare troppe partizioni in parallelo in un cluster di grandi dimensioni, in quanto ciò può causare l'arresto anomalo dei sistemi di database esterni.