Аналіз глобальних звільнень: всебічний SQL-проєкт з аналізу даних

Вступ:

У сучасному швидко змінюваному ринку праці звільнення стали важливою темою для дослідження. Цей проєкт використовує SQL для аналізу глобального набору даних про звільнення, зосереджуючи увагу на таких ключових тенденціях, як звільнення в окремих компаніях, галузеві патерни та вплив звільнень з часом. Очищення та візуалізація даних дозволяють отримати інсайти про фактори, які сприяють скороченню робочої сили в усьому світі.

Опис:

Цей проєкт передбачає очищення та аналіз набору даних про звільнення за допомогою SQL. Основні завдання включають видалення дублікатів, стандартизацію даних та обробку порожніх значень. Ми проводимо дослідження даних (Exploratory Data Analysis, EDA), щоб виявити загальну кількість звільнень по компаніях, галузях, країнах та роках. Техніки візуалізації даних допомагають показати тренди, такі як кількість звільнень на місяць, за етапами та рейтинги компаній.

I. ОЧИЩЕННЯ ДАНИХ

  1. Імпорт та відображення набору даних про звільнення:

pic

Набір даних про звільнення

  1. Функції, які ми будемо виконувати:

pic

  1. Створення копії набору даних

Причина: Найкраща практика — вносити зміни в копію набору даних, а не в оригінал.

pic

layoffsraw : Копія набору даних про звільнення_

i. ВИДАЛЕННЯ ДУБЛІКАТІВ/ПОВТОРЮВАНИХ РЯДКІВ

pic

Додавання rownumber до існуючої таблиці та видалення тих рядків, у яких rownumber більше за 1.

pic

Немає повторюваних рядків

ii. СТАНДАРТИЗАЦІЯ ДАНИХ

pic

Видалення непотрібних пробілів з колонки company, аналогічно треба стандартизувати кожну колонку, якщо це необхідно.

Примітка: Стандартизація означає не лише обрізання елементів колонки, а й усунення повторів, роботу з подібними категоріями тощо.

pic

Інший приклад стандартизації

iii. Робота з NULL / порожніми значеннями

pic

Перевірка на NULL або порожні значення

pic

Оновлено порожні/NULL значення в колонці industry

2. ДОСЛІДЖЕННЯ ДАНИХ

i. Компанії, які звільнили 100% своїх працівників

pic

ii. Загальна кількість звільнень по компаніях

pic

iii. Загальна кількість звільнень по галузях

pic

pic

iv. Загальна кількість звільнень по країнах

pic

pic

v. Загальна кількість звільнень по роках

pic

pic

vi. Загальна кількість звільнень по місяцях

pic

vii. Рейтинг компаній по кількості звільнень за рік

pic

також,

a. Звільнення по етапах

pic

b. Загальна кількість звільнень та відсотковий розподіл звільнень

pic

Топ компаній, що звільнили

pic

Висновок:

Дякуємо, що ознайомилися з цим проєктом. Завдяки аналізу даних про звільнення ми можемо краще орієнтуватися в складнощах ринку праці. Не соромтеся залишати відгуки або зв'язатися для обговорення подальших інсайтів!

Перекладено з: Analyzing Global Layoffs: A Comprehensive SQL Data Project

Leave a Reply

Your email address will not be published. Required fields are marked *