Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Devolva um novo DataFrame contendo a união de linhas neste e noutro DataFrame.
Sintaxe
union(other: "DataFrame")
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
other |
DataFrame | Outro DataFrame que precisa de ser unido. |
Devoluções
DataFrame: Um novo DataFrame contendo as linhas combinadas com as correspondentes colunas.
Notes
Este método realiza uma união de conjuntos ao estilo SQL das linhas de ambos DataFrame os objetos, sem deduplicação automática dos elementos.
Use o distinct() método para realizar a deduplicação de linhas.
O método resolve colunas por posição (não por nome), seguindo o comportamento padrão em SQL.
Exemplos
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+