Коли ми говоримо про підприємство, кожного дня генерується величезна кількість даних. Наприклад, у банку є транзакції клієнтів, процеси онбордингу, бізнес-процеси, активність зацікавлених осіб тощо. Ці дані критично важливі як для банку, так і для клієнта, однак ці дані можуть надати цінні інсайти, якщо їх правильно аналізувати та вивчати.
Серед усіх даних, що генеруються з різних джерел систем та користувачів, дані можна класифікувати на дві категорії: Курувані та Уніфіковані!
Простими словами, коли ви готуєте набір даних для інформаційної панелі керівника або створюєте навчальні дані для моделі машинного навчання — ви використовуєте курувані дані, а коли стандартизуєте визначення «Доходу» у всіх відділах (наприклад, продажі, фінанси тощо) або забезпечуєте, щоб поле «Ідентифікатор клієнта» у маркетингових даних відповідало «Ідентифікатору клієнта» у даних про продажі — це уніфіковані дані.
Що це таке?
Курувані дані — це дані, які були очищені, оброблені та підготовлені для конкретних випадків використання або аналізу. Ці дані часто знаходяться в куруваній зоні озера даних або в шарі презентації сховища даних. Вони призначені для кінцевого користувача та спеціалізованої аналітики.
Приклад: маркетингова команда курує набір даних, зосереджуючись на аналізі поведінки клієнтів, очищаючи та збагачуючи дані для відстеження ефективності кампанії.
Уніфіковані дані — це стандартизовані та послідовні дані, що охоплюють кілька наборів даних або доменів. Ці дані знаходяться в вимірювальній моделі сховища даних (наприклад, таблиці вимірювань). Вони виступають як єдине джерело правди, забезпечуючи узгодженість між відділами.
Приклад: поле «Ідентифікатор клієнта» стандартизовано таким чином, що як відділ продажів, так і маркетинг можуть посилатися на одних і тих же клієнтів, що дозволяє проводити міжвіддільний аналіз.
Як курувані, так і уніфіковані дані є необхідними для ефективного управління даними в підприємстві. Курувані дані вирішують нагальні, спеціалізовані потреби, в той час як уніфіковані дані забезпечують довготривалу узгодженість та цілісність в організації.
Перекладено з: Curated vs Conformed Data