SQL спрощено: саме те, що потрібно аналітикам даних - javascript.org.ua

текст перекладу

SQL (Structured Query Language) — це мова, що використовується для управління та запитів даних у реляційних базах даних (База даних, яка організовує дані у структуровані таблиці з рядками та стовпцями). У цих базах даних різні таблиці зв’язуються за допомогою первинних та зовнішніх ключів, що позначають відносини між ними.

Багато учнів часто прагнуть освоїти ключові концепції, необхідні для аналітичних ролей, але в результаті занурюються в непотрібні теми, які мають мало відношення до їхньої роботи. Для аналітичних ролей достатньо зосередитися лише на цих основних концепціях.

Основні запити

Основний SQL запит

SELECT: Використовується для вибору конкретних даних для отримання.
(*): Використовується для вибору всіх стовпців з таблиці в запиті.
FROM: Вказує таблицю або базу даних, з якої потрібно отримати дані.
WHERE: Застосовує умови для фільтрації даних.
DISTINCT: Отримує унікальні значення, усуваючи дублікати.
COUNT: Повертає загальну кількість рядків або значень, що не є NULL у вказаному стовпці.

Маніпуляція даними

INSERT: Додає нові рядки даних до таблиці.
UPDATE: Змінює існуючі дані в таблиці за певними умовами.
DELETE: Видаляє рядки з таблиці на основі умови.

Сортування та групування даних

ORDER BY: Використовується для сортування даних у зростаючому (за замовчуванням) або спадаючому порядку на основі одного або більше стовпців.

GROUP BY: Використовується для групування рядків, які мають однакові значення в зазначених стовпцях, часто використовується з агрегатними функціями (як-от COUNT, SUM, AVG) для виконання обчислень по кожній групі.

Агрегатні функції

COUNT: Повертає кількість рядків або значень, що не є NULL у стовпці.
SUM: Обчислює суму числового стовпця.

AVG: Обчислює середнє значення числового стовпця.
MIN: Повертає найменше значення в стовпці.
MAX: Повертає найбільше значення в стовпці.

Фільтрація даних

=, <, >: Використовуються для базових порівнянь.

BETWEEN: Фільтрує результати в межах певного діапазону.
LIKE: Використовується для пошуку за зразками в рядкових значеннях (підтримує шаблони, як-от % для кількох символів та _ для одного символу).
Приклад: WHERE name LIKE 'J%' повертає імена, які починаються на "J".

IN: Перевіряє, чи є значення в зазначеному списку значень.
Приклад: WHERE country IN ('USA', 'Canada', 'UK') повертає дані з цих країн.
NOT: Заперечує умову.

Для аналізу даних — аналіз часових рядів

Зазвичай виділяється конкретний період часу, і на основі цього проводиться фільтрація за потребою.

1.
текст перекладу

Дані по дням/тижням/місяцям/рокам

Головна сторінка звіту

Спеціальні інтервали можуть бути вибрані

Для конкретних днів тижня

Для потрібного формату

Іноді поточну дату використовують за вимогою —

Агрегування на основі часу —

Віконні функції

RANK() — Призначає ранг кожному рядку залежно від порядку, залишаючи прогалини, коли існують дублікати значень.

DENSE_RANK() — Призначає ранг кожному рядку залежно від порядку, як і RANK(), але без прогалин.

ROW_NUMBER() — Призначає унікальний номер кожному рядку залежно від порядку.

Загальні вирази таблиць (CTE)

Основний синтаксис —

Це спрощує складні запити, розбиваючи їх на частини, і дозволяє використовувати ту саму підзапит кілька разів у основному запиті.

Сподіваюся, ця інформація про SQL буде корисною для покращення ваших навичок аналізу даних і допоможе впевнено працювати з складними запитами. Успіхів у запитах!

Перекладено з: “SQL Simplified: Exactly What Data Analysts Need”

Вам також може сподобатися

Leave a Reply