текст перекладу
SQL (Structured Query Language) — це мова, що використовується для управління та запитів даних у реляційних базах даних (База даних, яка організовує дані у структуровані таблиці з рядками та стовпцями). У цих базах даних різні таблиці зв’язуються за допомогою первинних та зовнішніх ключів, що позначають відносини між ними.
Багато учнів часто прагнуть освоїти ключові концепції, необхідні для аналітичних ролей, але в результаті занурюються в непотрібні теми, які мають мало відношення до їхньої роботи. Для аналітичних ролей достатньо зосередитися лише на цих основних концепціях.
Основні запити
Основний SQL запит
- SELECT: Використовується для вибору конкретних даних для отримання.
- (*): Використовується для вибору всіх стовпців з таблиці в запиті.
- FROM: Вказує таблицю або базу даних, з якої потрібно отримати дані.
- WHERE: Застосовує умови для фільтрації даних.
- DISTINCT: Отримує унікальні значення, усуваючи дублікати.
- COUNT: Повертає загальну кількість рядків або значень, що не є NULL у вказаному стовпці.
Маніпуляція даними
- INSERT: Додає нові рядки даних до таблиці.
- UPDATE: Змінює існуючі дані в таблиці за певними умовами.
- DELETE: Видаляє рядки з таблиці на основі умови.
Сортування та групування даних
ORDER BY: Використовується для сортування даних у зростаючому (за замовчуванням) або спадаючому порядку на основі одного або більше стовпців.
GROUP BY: Використовується для групування рядків, які мають однакові значення в зазначених стовпцях, часто використовується з агрегатними функціями (як-от COUNT, SUM, AVG) для виконання обчислень по кожній групі.
Агрегатні функції
- COUNT: Повертає кількість рядків або значень, що не є NULL у стовпці.
- SUM: Обчислює суму числового стовпця.
- AVG: Обчислює середнє значення числового стовпця.
- MIN: Повертає найменше значення в стовпці.
- MAX: Повертає найбільше значення в стовпці.
Фільтрація даних
- =, <, >: Використовуються для базових порівнянь.
- BETWEEN: Фільтрує результати в межах певного діапазону.
- LIKE: Використовується для пошуку за зразками в рядкових значеннях (підтримує шаблони, як-от
%
для кількох символів та_
для одного символу).
Приклад:WHERE name LIKE 'J%'
повертає імена, які починаються на "J".
- IN: Перевіряє, чи є значення в зазначеному списку значень.
Приклад:WHERE country IN ('USA', 'Canada', 'UK')
повертає дані з цих країн. - NOT: Заперечує умову.
Для аналізу даних — аналіз часових рядів
Зазвичай виділяється конкретний період часу, і на основі цього проводиться фільтрація за потребою.
1.
текст перекладу
Дані по дням/тижням/місяцям/рокам
Головна сторінка звіту
Спеціальні інтервали можуть бути вибрані
Для конкретних днів тижня
Для потрібного формату
Іноді поточну дату використовують за вимогою —
Агрегування на основі часу —
Віконні функції
- RANK() — Призначає ранг кожному рядку залежно від порядку, залишаючи прогалини, коли існують дублікати значень.
- DENSE_RANK() — Призначає ранг кожному рядку залежно від порядку, як і RANK(), але без прогалин.
- ROW_NUMBER() — Призначає унікальний номер кожному рядку залежно від порядку.
Загальні вирази таблиць (CTE)
Основний синтаксис —
Це спрощує складні запити, розбиваючи їх на частини, і дозволяє використовувати ту саму підзапит кілька разів у основному запиті.
Сподіваюся, ця інформація про SQL буде корисною для покращення ваших навичок аналізу даних і допоможе впевнено працювати з складними запитами. Успіхів у запитах!
Перекладено з: “SQL Simplified: Exactly What Data Analysts Need”