Запити SQL у ноутбуці Kaggle

pic

Вам знадобляться наступні речі, щоб розпочати:

  1. Позбутися страху перед програмуванням.
  2. Обліковий запис Kaggle.

Ми почнемо з входу у ваш профіль Kaggle. Як тільки ви увійшли, перейдіть до цього набору даних: https://www.kaggle.com/datasets/ajayt0m/nvidia-database

pic

Nvidia Database

Це база даних, яку я створив, щоб допомогти нам виконувати запити. Я випадково вибрав Nvidia як компанію та придумав її разом із GPT. Зауважте, що дані можуть здатися абсурдними в деяких місцях, але це не мета цього процесу — ми тут, щоб зрозуміти SQL, а не аналізувати реальні дані з цього вигаданого набору.

Ви також можете переглянути сторінку набору даних Kaggle, щоб зрозуміти, що містить файл .db.

Тепер натисніть кнопку “New Notebook” у верхньому правому куті сторінки. Це перенесе вас до нового інтерфейсу для написання коду. Найкраща частина? Оскільки ми створили цей ноутбук безпосередньо зі сторінки Nvidia Database, база даних автоматично підключена до ноутбука.

Простими словами, не потрібно вручну імпортувати або підключати базу даних — все вже налаштовано для вас.

Можете перейменувати ноутбук у щось типу “SQL Intro” або “SQL Day 1” (це можна зробити у верхній частині ноутбука). До речі, під ноутбуком я маю на увазі .ipynb файл — інтерактивний Python-ноутбук.

Ноутбуки Kaggle дозволяють виконувати код частинами, розбиваючи його на осередки (cells). Можливо, ви помітили осередок із деяким попередньо написаним кодом або коментарями, коли створили цей ноутбук.

Зробіть одну річ — виберіть усе в цьому осередку та ВИДАЛІТЬ!
Почнемо з чистого аркуша… це дійсно не потрібно.

Чудово! Тепер у вас є чистий простір для коду, і база даних уже підключена.

Перед тим як почати: виконуйте ці команди крок за кроком

Осередок 1:

# !pip install ipython-sql prettytable (run this if not installed)  

import prettytable  
prettytable.DEFAULT = 'DEFAULT'  

# !pip install ipython-sql (run this if not installed)  
%load_ext sql  

# Connect to the SQLite Database   
# Use the %sql magic command to connect to your database   
%sql sqlite:////kaggle/input/nvidia-database/nvidia_database.db

Натисніть на осередок, а потім натисніть Ctrl+Enter, щоб виконати. Нічого особливого не станеться — це просто виконається без жодного видимого результату.

Тепер все готово. Погнали до SQL! Нарешті.

Осередок 2:

%%sql  
-- Display all the tables in the database  
SELECT *  
FROM sqlite_master   
WHERE type='table';

%%sql на початку повідомляє осередку: “Гей, цей осередок тепер лише для SQL-команд.”

Текст, який починається з --, є коментарем. Коментар — це просто примітка для вас (або інших), щоб зрозуміти, що робить код. Коментарі не виконуються. Не можу повірити, що пояснюю коментарі 🥲.

Виконайте Осередок 2, щоб побачити, що станеться.

pic

Результат Осередка 2

Це покаже вам деталі всіх таблиць, що є в підключеній базі даних, яка називається nvidia_database.db. Для довідки: таблиця "sqlite_sequence" не була створена мною — вона генерується автоматично.

Тепер отримаймо зведення всіх таблиць і кількість записів (рядків) у кожній.

Осередок 3:

%%sql  
-- Display all the tables and the number of records in each  
SELECT *  
FROM sqlite_sequence;

pic

Результат Осередка 3

Підсумок

Вітаю! Тепер ви готові почати виконувати SQL-запити в цьому ноутбуці Kaggle. Якщо у вас вже є певний досвід роботи з SQL, можете досліджувати таблиці та дані в них самостійно.

Якщо ви повний новачок або хочете слідувати за мною, очікуйте на наступний блог — ми будемо детально розглядати запити до даних крок за кроком. До того часу, приємного кодування!

Перекладено з: Query SQL in a Kaggle Notebook

Leave a Reply

Your email address will not be published. Required fields are marked *