12 подписчиков

✅ Тестовое на аналитика данных. Задачка по SQL.

Просматривала я аналитические каналы и вижу интересное тестовое. У меня мозг на автомате начал накидывать варианты и уже прям не терпелось написать скрипт.

Думаю это будет полезным для всех.

Итак, есть две таблички: с отделами и данными по зарплате у сотрудников и их начальников.

Создадим быстренько датафреймы, на котором потренируемся прям в юпитер ноутбуке с помощью библиотеки pandasql. Про эту библиотеку пост тут.

data = {'id': [1,2,3,4,5,6],

'name': ['Финансы','Риски','Розница','Безопасность','ДКК','Аналитика']}

Departament = pd.DataFrame(data)

data = { 'id': [1,2,3,4,5,6],

'id_head': [1, 1,2,4,5,3],

'id_dep':[2,2,3,3,8,4],

'sal': [45000,80000,100000,65000,35000,50000] }

Personal = pd.DataFrame(data)

📌Задание 1. Вывести отдел с наибольшим числом сотрудников.

Самый простой способ:

select d.name as Department,

count(p.id) as count_personal

from Personal p

join Departament d on d.id = p.id_dep

group by 1

order by 1 desc

limit 1

Но в случае если у нескольких отделов одинаковое количество сотрудников, то результат выдаст один отдел, а не два.

Поэтому рекомендую сделать второй вариант через подзапрос. Можете потренироваться - написать сами.

📌Задание 2. Вывести список сотрудников, получающих заработную плату выше, чем у руководителя. Вот тут уже интересненько.

Это можно реализовать соединив таблицу с этой же модифицированной таблицей. Сделаем табличку с помощью группировки, чтобы был уникальный сотрудник и его з/пл. И присоединим ее с помощью left join к основной по ключу p1.id_head = p2.id.

Тогда в одной строке будет и з/пл сотрудника и з/пл его руководителя. И потом оставляем тех, у кого sal>sal_head

select p1.id

from Personal p1

join (select id,sal as sal_head

from Personal

group by 1) p2 on p1.id_head = p2.id

where sal>sal_head

📎 Тут ноутбук с решением.

✅ Тестовое на аналитика данных. Задачка по SQL. Просматривала я аналитические каналы и вижу интересное тестовое.

1 минута

30 марта 2024