Тиражирование результатов pd.merge в SQL?

голоса
0

Я игрался с некоторыми наборами данных локально на Python, а теперь пытаюсь реплицировать те же результаты в облачной среде с помощью SQL

У меня есть 3 таблицы, каждая с несколькими дубликатами ID. Например, таблица A будет содержать IDsa, b, c, d, ..., таблица B - IDsa, c, e, a1, a2 ..., а таблица C - IDs d, f, a2, b1, b2, ...

В настоящее время я делаю pd.mergeдля таблицы A и таблицы B по IDa, а также для таблицы C с результирующей таблицей из первого слияния по IDa2. При использовании pd.merge, я заметил, что это добавит a _xили a _yк идентификаторам дубликатов (под этим я подразумеваю, что в первом pd.mergeиз таблицы A и в таблице B, cиз таблицы A станетc_x, а cиз таблицы B станет c_yи так далее для любых других идентификаторов дубликатов. То же самое относится и к любым другим идентификаторам дубликатов для любых соединений

Как можно повторить этот процесс и обойти проблему с дублированием идентификаторов в SQL?

Задан 26/05/2020 в 03:30
источник пользователем
На других языках...                            


1 ответов

голоса
0

Я думаю, что вы можете переименовать в join остальные объединенные колонки с новыми именами:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Надеюсь, вы найдете это полезным.

Ответил 10/06/2020 в 15:51
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more