Статистика на практиці: Оцінка прискорення сили тяжіння в комфорті власного дому

Чи уявляли ви собі, що можна визначити прискорення гравітації, не виходячи з дому? У цьому дописі я покажу, як я використав інферентну статистику та базову фізику на практиці й весело, щоб оцінити це фундаментальне значення з фізики. Лишень за допомогою маленької кульки з паперу, секундоміра та рулетки я зробив 50 простих вимірювань, даючи кульці падати з відомої висоти. Я проаналізував дані, використовуючи основні статистичні концепції, і, дивовижно, зміг наблизитись до відомих 9,81 м/с²! Окрім того, я дослідив, як кількість вимірювань впливає на точність результатів.

pic

Photo by Benjamin Recinos on Unsplash

Вступ

Цікавим напрямком у статистиці є інферентна статистика. Це важлива гілка статистики, що дозволяє оцінювати параметри популяції без необхідності мати доступ до всієї популяції.

Класичний приклад із підручників з статистики — це оцінка середнього зросту хлопців у школі, використовуючи випадкову вибірку з кількох учнів. Процес полягає у зборі даних щодо зросту кількох хлопців і, виходячи з цих даних, робиться висновок щодо середнього зросту всіх хлопців у школі. Такий підхід широко застосовується в різних сферах, оскільки дозволяє робити висновки про великі популяції з допомогою репрезентативної вибірки, що економить час та ресурси.

Інший приклад — це опитування громадської думки / вибори, коли опитують репрезентативну вибірку виборців, щоб передбачити розподіл голосів на виборах, без необхідності опитувати всіх виборців, що було б неможливо в країнах з мільйонними або кількасоттисячними населеннями.

У контролі якості виробництва також часто вибирають випадкову вибірку з продукції на виробничій лінії, щоб перевірити, чи відповідають товари встановленим стандартам якості. Це дозволяє робити висновки щодо якості всієї партії без необхідності тестувати кожен одиничний товар.

Ці приклади демонструють, як інферентна статистика є критично важливою для прийняття рішень у різних сферах, навіть коли доступ до популяції неможливий.

У сьогоднішньому дописі ми розглянемо практичний приклад того, як ми можемо застосувати інферентну статистику для оцінки фундаментальної сталої, яка присутня з нами завжди — прискорення гравітації. Для цього ми проведемо експеримент, який кожен може здійснити вдома. Після збору даних ми проаналізуємо результати й використаємо інферентну статистику для розрахунку середнього значення та довірчого інтервалу, щоб оцінити прискорення гравітації на основі отриманих вибірок. Для цього нам знадобиться лише секундомір і кулька з паперу.

Наша мета тут — просто показати інший, легкий спосіб застосування інферентної статистики.

Варто зазначити, що для спрощення цього невеликого проекту ми не враховуватимемо низку факторів. Пояснюю, кожне вимірювання має певну похибку, оскільки сам інструмент вимірювання вводить невизначеності. У нашому випадку невизначеності пов'язані з вимірюваннями часу та висоти, які будуть виконуватись за допомогою секундоміра і рулетки. В більш складному експерименті, проведеному в лабораторії, необхідно враховувати ці помилки, а також їх поширення у формулах, які ми використовуватимемо.

Однак давайте не будемо враховувати ці фактори й зосередимося на застосуванні інферентної статистики в спрощеному вигляді.

Наступні розділи стосуються того, як провести експеримент, коротко ознайомити з теоретичним розвитком, необхідним для розуміння того, що ми робимо, показати результати та проведений аналіз, а також підсумувати висновки.

Експеримент

Цей експеримент досить простий, все, що нам буде потрібно — це кулька з паперу, секундомір (який можна знайти онлайн за посиланням https://www.online-stopwatch.com/portuguese/full-screen-stopwatch.php), рулетка та поверхня, яка буде використовуватися як орієнтир висоти.

Процедури також прості та прямі:

  1. Виміряйте висоту поверхні орієнтира до підлоги і зафіксуйте значення.
  2. Помістіть кульку з паперу на поверхню орієнтира.
  3. Відпустіть кульку, щоб вона падала вільно до підлоги.
  4. Одночасно запустіть секундомір, коли кулька буде відпущена.
  5. Зупиніть секундомір, як тільки кулька досягне підлоги, і зафіксуйте значення.
  6. Повторіть кроки 2–5 N разів для отримання більше даних.

У моєму випадку я проводив цей експеримент у своїй кімнаті, використовуючи свій стіл як орієнтир висоти. Наступне зображення показує мій стіл разом з виміряною висотою за допомогою рулетки.

pic

Столик з орієнтиром висоти. Джерело: Автор

Кулька завжди розміщувалася на верхній горизонтальній рисці, як на фото вище, і потім відпускалася для падіння до підлоги. Час падіння вимірювався за допомогою онлайн-секундоміра, оскільки секундомір мого телефону має роздільну здатність 10 мілісекунд, тоді як онлайн-секундомір пропонує роздільну здатність 1 мілісекунда.

Пам'ятаєте, я казав, що ігноруватиму помилки вимірювань, тож можливо гарним виправданням будуть грубі помилки, скоєні в момент включення й зупинки секундоміра. Для цього експерименту необхідно робити кілька спроб, щоб отримати мінімальний рефлекс, але навіть так людський час реакції може вносити помилку, більшу за будь-яку іншу помилку вимірювань, пов'язану з секундоміром.

Іншою джерелом помилки є розміщення кульки. У моєму випадку я тримав її рукою, намагаючись зберігати однаковий стандарт між експериментами, але, без сумніву, ця висота змінювалася під час вимірювань.

Таким чином, ці два джерела помилки можуть разом вносити значні відхилення порівняно з помилками самих вимірювальних приладів. І, можливо, це є виправданням того, чому ми не будемо враховувати помилки, внесені рулеткою та секундоміром.

Теоретичний розвиток

Перед тим, як перейти до статистичних понять і їх застосування для визначення прискорення гравітації, необхідно коротко обговорити фізику, яка лежить в основі цієї проблеми. Для деяких це може бути тортурою, але це абсолютно необхідно в нашому контексті.

Для початку давайте згадаємо рівняння руху для позиції, яке ми вивчали на уроках фізики в першому класі середньої школи. Це рівняння описує рух прискореного об'єкта і стане основою для нашої оцінки g.

де

  • h: Позиція або кінцева висота кульки. У нашому випадку це буде нуль, оскільки кінцева позиція буде на землі.
  • h0: Початкова позиція або висота кульки, що дорівнює 73 см.
  • v0: Початкова швидкість кульки. Ця змінна дорівнює нулю, оскільки кулька буде відпущена з нерухомого стану.
  • a: Прискорення, яке ми хочемо оцінити. У нашому випадку a = −g.
    > Адже в нашій системі відліку прискорення "направлене" вниз з величиною g.
  • t: Це інтервал часу.

При маніпуляціях із рівнянням вище та підставленні відомих значень, ми отримуємо теоретичну формулу, яка пов'язує час падіння з прискоренням гравітації (g), яке є близьким до поверхні Землі:

Це рівняння дозволяє нам розрахувати прискорення гравітації (g) на основі часу, який кулька витрачає на падіння до підлоги.

Ми знаємо, що стандартне значення g на Землі приблизно дорівнює 9.81 м/с². Підставляючи це значення та ізолюючи час (t) в рівнянні вище, ми можемо розрахувати теоретичний час, необхідний для падіння кульки з висоти 73 см. Результат — приблизно 386 мілісекунд.

Після проведення експерименту 50 разів, ми отримали список із 50 значень часу. З цими часами можна розрахувати список із 50 значень для g, використовуючи рівняння, представлене раніше. З цих вимірів ми застосуємо теорію інферентної статистики для оцінки параметра популяції, а саме справжнього прискорення гравітації.

Вибір провести 50 вимірів базується на Теоремі центральної межі. Ця теорема дозволяє припустити, що для достатньо великої кількості зразків, розподіл середніх значень зразків наближається до нормального розподілу, незалежно від початкового розподілу даних. Середнє значення цього розподілу є незміщеним оцінювачем параметра популяції, тобто воно дає надійну оцінку прискорення гравітації. Крім того, стандартне відхилення цього розподілу, яке називається стандартною помилкою, дозволяє кількісно оцінити невизначеність, пов'язану з оцінкою середнього через побудову довірчого інтервалу.

Однак оцінка через середнє — це лише одна точка, і цього недостатньо для надійного аналізу. Більш надійно побудувати довірчий інтервал навколо цього середнього, надаючи діапазон значень, який містить параметр популяції з певним рівнем довіри. Для цього ми використовуватимемо стандартну помилку та побудуємо довірчий інтервал з рівнем довіри 95%, хоча можна вибрати й будь-який інший рівень.

Результати

Результати вимірювань були збережені в таблиці на Google Drive, і з виміряними часами ми розрахували значення g для кожного експерименту, використовуючи рівняння, яке було представлено в розділі теоретичного розвитку. Наступне зображення показує, як ці результати були структуровані.

pic

Столбчик # — номер експерименту, столбчик час (с) показує час падіння кульки в секундах, а столбчик g — це прискорення гравітації, розраховане за часом у м/с².

З цього списку з 50 значень g ми можемо розглянути кілька цікавих аспектів інферентної статистики.

  1. Оцінка g з використанням списку зразків.
  2. Розуміння того, як розмір вибірки впливає на результати інферентного аналізу.

Тепер давайте проаналізуємо кожен випадок окремо.

1. Оцінка g через вибірку розміром 50

Це завдання досить просте, нам потрібно лише обчислити середнє значення з 50 значень g, використовуючи стандартну формулу для середнього:

Після виконання розрахунків ми отримали середнє значення 10.30 м/с². Зазвичай g дорівнює 9.81 м/с², тому різниця між оціненим значенням та значенням за стандартом становить 0.49 м/с². Чи є це хорошим чи поганим результатом? Є кілька способів оцінити, один із практичних методів — це розрахувати відсоткову похибку.

Отже, розрахована відсоткова похибка становить 4.97%, що є досить хорошим значенням.

Ще один цікавий момент, на який варто звернути увагу — це інші описові статистики:

pic

Описові статистики для розрахованих прискорень. Джерело: Автор

Ого, медіана становить 9.90 м/с²!!

Добре, давайте повернемося до нашого доброго старого середнього.
Середнє значення — це наш незміщений оцінювач, однак воно є лише точковою оцінкою. Як ми можемо надати більшої надійності нашому результату? Через довірчий інтервал!

У цьому випадку довірчий інтервал буде розрахований навколо середнього значення за допомогою наступної формули:

де g бар — це середнє значення, z — критичне значення, sigma — стандартне відхилення популяції, а n — розмір вибірки.

У нашому випадку ми не знаємо стандартне відхилення популяції, тому використовуватимемо стандартне відхилення самої вибірки.

Критичне значення z буде встановлено на рівні 1.96, що відповідає рівню довіри 95%, коли ми використовуємо нормальний розподіл. Ми можемо припустити нормальний розподіл, оскільки наша вибірка має достатній розмір. Однак, як ми побачимо пізніше, для менших вибірок необхідно використовувати критичне значення з розподілу t-Стьюдента для рівня довіри 95%.

Провівши ці розрахунки, ми отримали:

pic

Середнє значення з відповідним довірчим інтервалом.

Ого, дивіться, як наш результат виглядає набагато цікавіше зараз. Довірчий інтервал, розрахований із базових статистичних даних і з ігноруванням багатьох інших аспектів, містить значення 9.81 м/с². Це дуже хороший результат, враховуючи, що експеримент проводився в кімнаті з нерівною кулькою, онлайн-хронометром і "на око", повністю покладаючись на мої моторні навички. Або я дуже хороший, або статистика дійсно працює, і це неймовірно!

Тепер давайте подивимося на розподіл, який ми отримали у вибірці з 50 вимірів.

pic

Розподіл прискорень у вибірці розміром 50. Джерело: Автор

Подивіться, як цікаво: хоча це й не ідеальна гауссова крива, цей розподіл вже дуже схожий на таку.

2. Вплив розміру вибірки

Уявімо ситуацію, коли збір зразків обмежений, що може статися з різних причин. Наприклад, отримати нові зразки може бути складно, дорого, або вам просто ліньки кидати кульку 100 разів і вимірювати час, який вона потребує, щоб досягти підлоги.

У такому випадку розглянемо ситуації, коли ми зробили лише 10, 20, 30 і, в кінцевому підсумку, 40 перших вимірів. Також ми могли б зробити випадкову пересемплінг без повернення.

Процедура в кожному випадку буде такою ж, як і в попередньому розділі: розрахуємо середнє значення та відповідний довірчий інтервал для кожного розміру вибірки. Але пам’ятайте, що тепер ми будемо працювати з меншими вибірками, тому потрібно використовувати критичні значення з розподілу t-Стьюдента.

Для початку давайте подивимося на розподіл для кожного розміру вибірки.

pic

Розподіл прискорень для різних розмірів вибірки. Джерело: Автор

Зверніть увагу, як форма кривої поступово наближається до дзвоновидного розподілу, коли розмір вибірки збільшується. Ви, читачу, вважаєте, що цей ефект спричинений законом великих чисел, теоремою центральної межі, чи у вас є інші здогадки?

Тепер давайте розрахуємо середнє значення та довірчий інтервал для кожного з цих випадків.

pic

Середнє значення та довірчий інтервал для кожного розміру вибірки. Джерело: Автор

Найцікавіше, що варто відзначити тут, це те, як довірчий інтервал звужується, коли ми збільшуємо розмір вибірки. Це насправді очікувано, оскільки, як ми бачили раніше, довірчий інтервал може бути зрозумілий як зворотна функція від квадратного кореня з розміру вибірки, тобто чим більша вибірка, тим меншим буде довірчий інтервал.

Не забувайте, що для вибірки розміром 50 довірчий інтервал був 0.49.
Таким чином, можна помітити, що різниця між інтервалами зменшується зі збільшенням розміру вибірки. Різниця склала 0.51 між 10 і 20 вимірами, 0.1 між 30 і 40 вимірами, та 0.08 між 40 і 50 вимірами. Цю поведінку можна пояснити наявністю квадратного кореня у формулі для довірчого інтервалу.

Спочатку більші розміри вибірки є перевагою, але з ростом вибірки практичні переваги зменшуються. Крім того, розподіл для вибірки розміром 40 практично ідентичний розподілу для вибірки розміром 50.

Ми могли б ще більше покращити наші результати, якщо б краще обробили дані, наприклад, аналізуючи та відкидаючи можливі викиди.

В кінцевому підсумку варто відзначити, що всі інтервали містять наше референсне значення, яке становить 9.81 м/с².

Висновки

Цей експеримент показав нам деякі цікаві результати! По-перше, ми змогли довести, що можна зробити надзвичайно точну оцінку прискорення сили тяжіння, використовуючи прості матеріали в кімнаті. Наше середнє значення 10.30 м/с² відрізняється лише на 5% від референсного значення (9.81 м/с²), що є дуже хорошим результатом, враховуючи умови експерименту.

Один із найцікавіших аспектів — це спостереження за теоремою про центральну межу, що відбувається на практиці. Зі збільшенням кількості вимірів ми чітко побачили, як розподіл даних поступово наближається до нормальної кривої, як і передбачає теорія.

Ще один важливий момент, який ми дізналися — це оптимальна кількість вимірів. Дані показали, що після 40 вимірів виграш у точності почав значно зменшуватися. Наприклад, різниця в довірчому інтервалі між 40 і 50 вимірами була лише 0.08, що значно менше, ніж різниця між вимірами 10 і 20, яка склала 0.51.

Цікавим є також той факт, що навіть з меншими вибірками наші довірчі інтервали завжди включали референсне значення 9.81 м/с². Це свідчить про те, що метод є надійним навіть з обмеженою кількістю вимірів, хоча більша кількість вимірів забезпечує більшу точність.

Джерела

NUSSENZVEIG, Herch Moysés. Курс з основ фізики: Механіка (т. 1). Видавництво Blucher, 2013.

BUSSAB, Wilton de O.; MORETTIN, Pedro A. Основи статистики. У: Основи статистики. 2010. с. xvi, 540-xvi, 540.

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Ми дійшли до кінця ще однієї статті, сподіваюся, що вам сподобалося читати.

Не соромтесь підписатися на мене в LinkedIn і тут, на Medium, щоб отримувати більше контенту.

Перекладено з: Estatística na prática: Estimando a aceleração da gravidade no conforto do lar

Leave a Reply

Your email address will not be published. Required fields are marked *