COVID-19: Аналіз впливу на штати США та коледжі за допомогою SQL

Пандемія COVID-19 змінила світ незбагненним чином. Цей проєкт зосереджений на аналізі прогресії COVID-19 у США, виявленні закономірностей у випадках і смертях, а також дослідженні її специфічного впливу на навчальні заклади. Використовуючи SQL як основний інструмент аналізу, цей аналіз надає практичні висновки для зацікавлених сторін, таких як працівники охорони здоров’я, політики та адміністрації навчальних закладів.

Огляд набору даних

  1. Дані COVID-19 США: Статистика на рівні штатів і округів з NY Times COVID-19 Data Repository та глобальні дані з Kaggle.
  2. Географічні дані: Інформація про штати, округи та міста США.
  3. Дані COVID-19 для коледжів США: Випадки COVID-19, зареєстровані в коледжах США в 2020 і 2021 роках.

Інструменти та технології

Весь аналіз був проведений за допомогою Microsoft SQL Server, який надав гнучкість для запитів та обробки великих наборів даних ефективно. Для отримання висновків з сирих даних були використані основні SQL техніки, такі як з’єднання (joins), агрегації (aggregations), підзапити (subqueries) та індексація (indexing).

Ключові запити та висновки

1. Національні та штатні тенденції COVID-19

Отримання загальної кількості випадків і смертей у США, згрупованих за ISO кодом.

SELECT iso_code, SUM(cases + deaths) AS total   
FROM Worldwide_Cases   
WHERE iso_code = 'USA'   
GROUP BY iso_code;

pic

Загальна кількість випадків і смертей у США

Цей аналіз показав, що в США було зареєстровано понад 283 мільйони випадків і смертей у загальному підсумку за період аналізу.

2. Порівняльний глобальний аналіз

Обчислення середньої кількості випадків і смертей у світі (без урахування США).

SELECT AVG(cases) AS avg_cases, AVG(deaths) AS avg_deaths   
FROM Worldwide_Cases   
WHERE country != 'United States';

pic

Середня кількість випадків і смертей

Цей аналіз показав, що середня кількість випадків складає 534 тисячі, а смертей — 12 тисяч у світі, за винятком США.

3. Регіональні варіації: міста та штати

Підрахунок кількості міст у кожному штаті.

SELECT state, COUNT(city) AS city_count   
FROM US_States   
GROUP BY state;

pic

Кількість міст у кожному штаті США

Штати з вищим рівнем урбанізації продемонстрували більшу концентрацію міст, що може корелювати з більшою кількістю випадків COVID-19.

4. Часові тенденції: випадки і смерті з часом

Аналіз випадків і смертей у світі з травня 2020 року по січень 2021 року.

SELECT iso_code, cases, deaths   
FROM Worldwide_Cases   
WHERE date BETWEEN '2020-05-01' AND '2021-01-01';

pic

pic

Збільшення випадків і смертей по всьому світу

Цей період зафіксував критичні сплески, що дозволяє зрозуміти, як певні періоди посилили вплив пандемії.

5. Коледжі з високим впливом

Ідентифікація коледжів з загальною кількістю випадків понад 500 за допомогою створення подання (view).

CREATE VIEW highCovid AS   
SELECT clg_ID, SUM(cases2020 + cases2021) AS total_cases   
FROM US_College_Cases   
WHERE cases2020 > 500   
GROUP BY clg_ID;

pic

Подання для комбінованих випадків

Були ідентифіковані коледжі з надзвичайно високими показниками випадків.

Вплив на навчальні заклади

Перелік коледжів, де кількість випадків у 2020 році перевищувала 100 і назви яких починаються на «U».

SELECT clg_name   
FROM US_College_Cases   
WHERE cases2020 > 100   
AND clg_name LIKE 'U%';

pic

pic

Загалом 183 коледжі, у яких було понад 100 випадків

183 коледжі були потрапили під вплив пандемії, зокрема університети, що домінували у списку. Це відображає їхню велику кількість студентів і унікальні виклики, з якими вони зіткнулися під час пандемії.

7. Аналіз найвищого впливу

Знаходження міста та коду штату коледжів з найбільшою кількістю випадків у 2020 році.

SELECT UR.city, UR.state_code   
FROM USCollegeRel AS UR   
JOIN US_College_Cases AS UC   
 ON UR.clg_ID = UC.clg_ID   
WHERE cases2020 = (SELECT MAX(cases2020) FROM US_College_Cases);

pic

Штати з урбаністичними хабами мали більше випадків

Міста та штати з урбаністичними хабами мали більше випадків, що свідчить про вплив щільності населення.

8. Коледжі з нульовими або мінімальними випадками

Знаходження коледжів, де у 2020 році було зареєстровано нуль або дуже мало випадків.

SELECT clg_ID, clg_name   
FROM US_College_Cases   
WHERE cases2020 = 0 OR cases2020 <= 1;

pic

Коледжів без випадків не виявлено

Не було виявлено жодного коледжу з нульовими або мінімальними випадками, що свідчить про те, що всі коледжі зазнали впливу COVID-19.

Виклики та уроки

  • Складність даних: Обробка великих наборів даних з різним рівнем деталізації вимагала стратегічного індексування та оптимізації запитів.
  • Об’єднання даних: Об’єднання даних з різних таблиць для отримання значущих висновків вимагало ретельного планування та валідації.
  • Практичні висновки: Проєкт підкреслив важливість представлення технічних результатів таким чином, щоб вони були зрозумілі непрофесіоналам.

Ключові висновки

  1. Тренди на національному рівні: Комплексний огляд розвитку COVID-19 у США надає важливий контекст для політиків.
  2. Вплив на освіту: Висновки щодо випадків у коледжах дозволяють адміністраціям навчальних закладів покращити стратегії кризового управління.
  3. Практичні порівняння: Порівнюючи глобальні та регіональні дані, зацікавлені сторони можуть оцінити відносну ефективність та виявити області для покращення.

Висновок

Цей аналіз на основі SQL дає уявлення про далекосяжні наслідки COVID-19 для штатів США та коледжів. Розкриваючи тенденції, підкреслюючи регіональні відмінності та надаючи специфічні висновки для навчальних закладів, цей проєкт пропонує цінний ресурс для тих, хто прагне зрозуміти та пом’якшити вплив пандемії в освітньому середовищі.

Досліджуйте повний проєкт та SQL скрипти тут.

Перекладено з: COVID-19: Analyzing the impact on U.S. States and Colleges with SQL

Leave a Reply

Your email address will not be published. Required fields are marked *