SQL спрощено: саме те, що потрібно аналітикам даних

текст перекладу

SQL (Structured Query Language) — це мова, що використовується для управління та запитів даних у реляційних базах даних (База даних, яка організовує дані у структуровані таблиці з рядками та стовпцями). У цих базах даних різні таблиці зв’язуються за допомогою первинних та зовнішніх ключів, що позначають відносини між ними.

Багато учнів часто прагнуть освоїти ключові концепції, необхідні для аналітичних ролей, але в результаті занурюються в непотрібні теми, які мають мало відношення до їхньої роботи. Для аналітичних ролей достатньо зосередитися лише на цих основних концепціях.

Основні запити

pic

Основний SQL запит

  • SELECT: Використовується для вибору конкретних даних для отримання.
  • (*): Використовується для вибору всіх стовпців з таблиці в запиті.
  • FROM: Вказує таблицю або базу даних, з якої потрібно отримати дані.
  • WHERE: Застосовує умови для фільтрації даних.
  • DISTINCT: Отримує унікальні значення, усуваючи дублікати.
  • COUNT: Повертає загальну кількість рядків або значень, що не є NULL у вказаному стовпці.

Маніпуляція даними

  • INSERT: Додає нові рядки даних до таблиці.
  • UPDATE: Змінює існуючі дані в таблиці за певними умовами.
  • DELETE: Видаляє рядки з таблиці на основі умови.

pic

Сортування та групування даних

ORDER BY: Використовується для сортування даних у зростаючому (за замовчуванням) або спадаючому порядку на основі одного або більше стовпців.

GROUP BY: Використовується для групування рядків, які мають однакові значення в зазначених стовпцях, часто використовується з агрегатними функціями (як-от COUNT, SUM, AVG) для виконання обчислень по кожній групі.

pic

Агрегатні функції

  • COUNT: Повертає кількість рядків або значень, що не є NULL у стовпці.
  • SUM: Обчислює суму числового стовпця.

pic

  • AVG: Обчислює середнє значення числового стовпця.
  • MIN: Повертає найменше значення в стовпці.
  • MAX: Повертає найбільше значення в стовпці.

pic

Фільтрація даних

  • =, <, >: Використовуються для базових порівнянь.

pic

  • BETWEEN: Фільтрує результати в межах певного діапазону.
  • LIKE: Використовується для пошуку за зразками в рядкових значеннях (підтримує шаблони, як-от % для кількох символів та _ для одного символу).
    Приклад: WHERE name LIKE 'J%' повертає імена, які починаються на "J".

pic

  • IN: Перевіряє, чи є значення в зазначеному списку значень.
    Приклад: WHERE country IN ('USA', 'Canada', 'UK') повертає дані з цих країн.
  • NOT: Заперечує умову.

Для аналізу даних — аналіз часових рядів

Зазвичай виділяється конкретний період часу, і на основі цього проводиться фільтрація за потребою.

1.
текст перекладу

Дані по дням/тижням/місяцям/рокам

pic

Головна сторінка звіту

pic

Спеціальні інтервали можуть бути вибрані

pic

Для конкретних днів тижня

pic

Для потрібного формату

pic

Іноді поточну дату використовують за вимогою —

pic

Агрегування на основі часу —

pic

Віконні функції

  1. RANK() — Призначає ранг кожному рядку залежно від порядку, залишаючи прогалини, коли існують дублікати значень.

pic

pic

  1. DENSE_RANK() — Призначає ранг кожному рядку залежно від порядку, як і RANK(), але без прогалин.

pic

pic

  1. ROW_NUMBER() — Призначає унікальний номер кожному рядку залежно від порядку.

pic

Загальні вирази таблиць (CTE)

Основний синтаксис —

pic

Це спрощує складні запити, розбиваючи їх на частини, і дозволяє використовувати ту саму підзапит кілька разів у основному запиті.

pic

Сподіваюся, ця інформація про SQL буде корисною для покращення ваших навичок аналізу даних і допоможе впевнено працювати з складними запитами. Успіхів у запитах!

Перекладено з: “SQL Simplified: Exactly What Data Analysts Need”

Leave a Reply

Your email address will not be published. Required fields are marked *