Вступ:
У сучасному швидко змінюваному ринку праці звільнення стали важливою темою для дослідження. Цей проєкт використовує SQL для аналізу глобального набору даних про звільнення, зосереджуючи увагу на таких ключових тенденціях, як звільнення в окремих компаніях, галузеві патерни та вплив звільнень з часом. Очищення та візуалізація даних дозволяють отримати інсайти про фактори, які сприяють скороченню робочої сили в усьому світі.
Опис:
Цей проєкт передбачає очищення та аналіз набору даних про звільнення за допомогою SQL. Основні завдання включають видалення дублікатів, стандартизацію даних та обробку порожніх значень. Ми проводимо дослідження даних (Exploratory Data Analysis, EDA), щоб виявити загальну кількість звільнень по компаніях, галузях, країнах та роках. Техніки візуалізації даних допомагають показати тренди, такі як кількість звільнень на місяць, за етапами та рейтинги компаній.
I. ОЧИЩЕННЯ ДАНИХ
- Імпорт та відображення набору даних про звільнення:
Набір даних про звільнення
- Функції, які ми будемо виконувати:
- Створення копії набору даних
Причина: Найкраща практика — вносити зміни в копію набору даних, а не в оригінал.
layoffsraw : Копія набору даних про звільнення_
i. ВИДАЛЕННЯ ДУБЛІКАТІВ/ПОВТОРЮВАНИХ РЯДКІВ
Додавання rownumber до існуючої таблиці та видалення тих рядків, у яких rownumber більше за 1.
Немає повторюваних рядків
ii. СТАНДАРТИЗАЦІЯ ДАНИХ
Видалення непотрібних пробілів з колонки company, аналогічно треба стандартизувати кожну колонку, якщо це необхідно.
Примітка: Стандартизація означає не лише обрізання елементів колонки, а й усунення повторів, роботу з подібними категоріями тощо.
Інший приклад стандартизації
iii. Робота з NULL / порожніми значеннями
Перевірка на NULL або порожні значення
Оновлено порожні/NULL значення в колонці industry
2. ДОСЛІДЖЕННЯ ДАНИХ
i. Компанії, які звільнили 100% своїх працівників
ii. Загальна кількість звільнень по компаніях
iii. Загальна кількість звільнень по галузях
iv. Загальна кількість звільнень по країнах
v. Загальна кількість звільнень по роках
vi. Загальна кількість звільнень по місяцях
vii. Рейтинг компаній по кількості звільнень за рік
також,
a. Звільнення по етапах
b. Загальна кількість звільнень та відсотковий розподіл звільнень
Топ компаній, що звільнили
Висновок:
Дякуємо, що ознайомилися з цим проєктом. Завдяки аналізу даних про звільнення ми можемо краще орієнтуватися в складнощах ринку праці. Не соромтеся залишати відгуки або зв'язатися для обговорення подальших інсайтів!
Перекладено з: Analyzing Global Layoffs: A Comprehensive SQL Data Project