Демографія та використання мобільних додатків: Інсайти щодо часу на екрані та уподобань

текст перекладу

Автори: Bonifer Bergantin, Kaijie Zhou, Zhehan Zhang, Denglei Wang,

Школа інформації, Університет Техасу в Остіні

Інструктор: Abhijit Mishra

pic

В епоху смартфонів наші щоденні взаємодії з мобільними пристроями визначають, як ми спілкуємося, працюємо, навчаємося та розважаємося. Інтеграція мобільних технологій в наше життя зробила їх важливими для визначення нашого благополуччя. Останні дослідження, як наприклад Цифрове покоління: зв'язок між щоденним використанням додатків на смартфонах та благополуччям від Schenkel та ін., показують, що тип додатків, якими ми користуємось, і наші патерни використання можуть мати тонкий вплив на наше психічне здоров'я, щастя і рівень стресу. Тому обдумане використання мобільних додатків є важливим для розблокування їх переваг при мінімізації потенційної шкоди.

Наш проект глибше досліджує це питання, використовуючи машинне навчання для аналізу зв'язку між демографією і використанням мобільних додатків. Використовуючи дані про вік, стать, час на екрані та патерни використання додатків, ми намагаємося передбачити, який тип додатків найімовірніше буде використовувати користувач — соціальні мережі, продуктивність або ігри. По ходу дослідження ми виявляємо, як різні категорії додатків впливають на благополуччя користувачів та їхню поведінку.

Розуміння набору даних

Наш аналіз побудований на Наборі даних про використання смартфонів і поведінку, доступному на Kaggle, який містить дані від 1,000 осіб. Цей набір даних включає інформацію про демографічні дані користувачів, час на екрані та патерни використання додатків. Основні змінні включають вік, стать, загальні години використання додатків, щоденний час на екрані та найбільш часто використовувану категорію додатка.

Для підготовки даних до машинного навчання ми виконали кілька перетворень:

  • Стать була перетворена в числові значення (Жінка = 0, Чоловік = 1).
  • Додано нову колонку, що позначає категорію додатка з найвищим часом використання, закодовану як Соціальні мережі = 0, Продуктивність = 1, Ігри = 2.
  • Числові дані, такі як години використання додатків і час на екрані, були нормалізовані за допомогою методу мінімально-максимального масштабування.
  • Набір даних був поділений на тренувальний (перші 500 користувачів) і тестовий (залишкові 500 користувачів) підмножини.

Ці етапи підготовки забезпечили готовність набору даних для аналізу та прогнозного моделювання.

Візуалізація патернів використання мобільних додатків

Наша візуальна аналітика виявила основні тенденції:

  1. Розподіл за віком: більшість користувачів були молодші за 30 років, з меншою часткою старших користувачів.
  2. Переваги додатків за категоріями: використання було майже рівномірно розподілене між додатками для соціальних мереж (33,1%), продуктивності (33,6%) і іграми (33,3%).
  3. Тренди за віком: молодші користувачі (до 30 років) віддавали перевагу соціальним мережам та іграм, тоді як використання додатків для продуктивності залишалося стабільним серед вікових груп, але значно зменшувалося після 60 років.

Ми також помітили відмінності за статтю:

  • Чоловіки схильні більше до використання додатків для продуктивності.
  • Жінки схильні до соціальних мереж.
  • Ігри найпопулярніші серед молодших чоловіків.

pic

pic

pic

Застосування машинного навчання

Для аналізу патернів використання додатків ми застосували дві моделі машинного навчання:

  • Логістична регресія: проста, інтерпретована модель, що використовується як базова.
  • Мультишаровий перцептрон (MLP): більш складна нейронна мережа, що здатна захоплювати нелінійні зв'язки.

Обидві моделі використовують п'ять ознак: вік, стать, загальні години використання додатків, щоденний час на екрані та загальна кількість використовуваних додатків.
текст перекладу

Мета полягала у передбаченні найбільш використовуваної категорії додатків для кожного користувача.

Результати та виклики

Початкова ефективність обох моделей показала низькі показники точності, при цьому Логістична регресія трохи перевершила MLP:

  • Логістична регресія: 37.4%
  • Kласифікатор MLP: 36.2%

Глибший аналіз з використанням таких метрик, як точність, відгук та F1-оцінки, виявив упередження та обмеження:

  • Логістична регресія працювала краще при прогнозуванні використання додатків для продуктивності серед чоловіків, але мала проблеми з жінками.
  • Kласифікатор MLP не зміг передбачити використання додатків для ігор, що вказує на значні обмеження.

Щоб зрозуміти прогнози, ми використали інструмент LIME (Local Interpretable Model-agnostic Explanations). Для одного з користувачів модель передбачила 55% ймовірність для використання додатків для продуктивності, при цьому вік і загальна кількість годин використання додатків стали основними факторами, що впливають.

Основні висновки та рекомендації

Наше дослідження підкреслює вплив демографії на переваги мобільних додатків:

  • Молодші користувачі схильні до соціальних мереж та ігор.
  • Старші користувачі віддають перевагу додаткам для продуктивності, з помітним зниженням після 60 років.
  • Стать впливає на використання додатків: чоловіки більше схильні до додатків для продуктивності та ігор, а жінки більше залучені до соціальних мереж.

Однак дослідження також виявило виклики:

  • Низька точність моделі та упередження, особливо при прогнозуванні використання додатків для жінок.
  • Недостатня різноманітність ознак у наборі даних обмежує прогностичну здатність.

Для покращення результатів майбутні дослідження повинні:

  • Включати додаткові демографічні фактори, такі як раса та освіта.
  • Досліджувати більш складні моделі, такі як класифікатори випадкових лісів, для підвищення точності.
  • Проводити більш масштабні дослідження для вирішення упереджень та виявлення ширших тенденцій, таких як цифровий розрив або соціальна ізоляція.

Реальні наслідки

Інсайти з цього дослідження можуть допомогти розробникам мобільних додатків створювати більш персоналізовані рішення. Розуміючи демографію користувачів, розробники можуть розробляти функції, що відповідають специфічним потребам, підвищуючи задоволеність користувачів та їхню залученість. Крім того, програмні компанії можуть скористатися цими тенденціями, щоб виявити можливості для інновацій та задоволення потреб різних користувацьких персон.

Окрім розробки додатків, ці результати мають соціальні наслідки. Наприклад, тривалий час на екрані серед старших користувачів може вказувати на соціальну ізоляцію, що спонукає до ініціатив щодо вирішення таких проблем. Оскільки мобільні технології продовжують розвиватися, дані, отримані в результаті досліджень, як ці, відіграватимуть важливу роль у формуванні більш інклюзивного та орієнтованого на людину цифрового майбутнього.

Посилання

Bhadra, M. (н.д.). Smartphone Usage and Behavioral Dataset [Data set]. Kaggle. https://www.kaggle.com/datasets/bhadramohit/smartphone-usage-and-behavioral-dataset?resource=download

Cox, E. (2015, 10 вересня). Even Grandpa Gets News from His Smartphone — Emma Cox — Medium. Medium. https://medium.com/@thereporter/even-grandpa-gets-news-from-his-smartphone-bd81796f2b83

Schenkel, K., Nussbeck, F. W., Kerkhoff, D., Scholz, U., Keller, J., & Radtke, T. (2024). Digital generation: the association between daily smartphone app use and well-being. Behaviour & Information Technology, 1–18. https://doi.org/10.1080/0144929X.2024.2406255

Thakur, M. (2023, 27 липня). Normalization formula. EDUCBA. https://www.educba.com/normalization-formula/

GitHub Repository: https://github.com/ZhehanZhang00/I310D-Final-Project-Data-Dance.git

Kaggle Dataset Link: https://www.kaggle.com/datasets/bhadramohit/smartphone-usage-and-behavioral-dataset?resource=download

Перекладено з: Demographics and Mobile App Usage: Insights on Screen Time and Preferences

Leave a Reply

Your email address will not be published. Required fields are marked *