У 2019 році я розробив модель для прогнозування страхових вимог автомобіля, використовуючи метод Random Forest та розгорнув її через Streamlit для створення інтерактивного додатку. Метою було передбачити, чи подасть страхувальник вимогу на основі таких параметрів, як вік страхувальника, вік автомобіля, регіон і термін дії поліса.
Для побудови моделі я використав датасет для прогнозування страхових вимог автомобіля з Kaggle. У наборі даних були відмічені нерівномірні класи, тому я застосував техніку SMOTE для балансу класів. Модель Random Forest виявилася ідеальною для цієї задачі, оскільки вона працює як з числовими, так і з категоріальними даними, а також зменшує перенавчання, об'єднуючи кілька дерев рішень.
Під час роботи з моделлю я також зіштовхнувся з проблемою нерівномірності класів в наборі даних, яку вдалося вирішити за допомогою SMOTE. Цей метод створює синтетичні зразки для меншості класу, що дозволяє моделі краще прогнозувати обидва класи.
Щоб зробити модель інтерактивною, я створив панель управління Streamlit, що дозволяє користувачам вводити такі параметри, як вік страхувальника, вік автомобіля, та регіон, і отримувати прогноз, чи будуть вони ймовірно подавати вимогу. Ось попередній перегляд додатку:
Спробуйте!
Ви можете взаємодіяти з живим додатком тут:
👉 Прогнозувальник страхових вимог
Цей проект став чудовим досвідом для мене, оскільки я зміг попрактикуватися в роботі з Random Forest, SMOTE та Streamlit, створюючи додаток, який може допомогти страховим компаніям приймати більш розумні рішення. Не соромтеся перевірити додаток і поділитися своїми думками!
Я Шараф Редді, захоплююсь машинним навчанням і прийняттям рішень на основі даних. Зв'язуйтесь зі мною на GitHub або LinkedIn.
Перекладено з: Predicting Car Insurance Claims with Random Forest and Streamlit