Дані — нова нафта.

text
pic

Це зображення є продуктом уяви штучного інтелекту — ця стаття моя та відредагована за допомогою Grammarly WJR

Дані — нова нафта

Що це означає?

Для більшості компаній це схоже на потік сирої нафти, що збирається на землі, забруднюючи навколишнє середовище.

Якщо це не має сенсу, уявіть собі сміттєвоза. Усе, що людина більше не хоче і не бачить в цьому жодної цінності, є сміттям. І якщо збирач сміття не має передбачливості, він просто продовжуватиме збирати його і викидати в одну велику купу. Це було половиною 20-го століття на Стейтен-Айленді. Сміття виходило з кожного району, накопичуючись. Потім хтось, хто зрозумів, що це не має майбутнього, вирішив розділити процес збору і організувати місце збору на органічне, неорганічне та придатне для переробки сміття.

Після цього вони побачили багатство у своїх руках: предмети, які можна було пересилати компаніям для повторного використання базових матеріалів, компостування біорозкладних матеріалів у ґрунт, а біологічні та органічні відходи перетворювати на енергію.

Дані проходять через той самий цикл. Дані виходять з усього і від усіх, хто ходить з телефонами, в’їжджає в автомобілі, літає на літаках, або заходить в будівлі чи будинки. Це безперервний потік сирих даних, які не переробляються в корисну інформацію.

Отже, як нам очистити дані?

Спочатку потрібно створити трубопровід від місця їх отримання до місця їх зберігання. Так само, як і сирої нафти, що перекачується з землі в резервуари для зберігання. З даними ми їх витягуємо, трансформуємо і завантажуємо в резервуари, відомі як таблиці.

Якщо дані не зовсім підходять для резервуара, ми повинні трансформувати ці сирі дані в колодязі цього резервуара, які ми називаємо полями.

Як тільки цей трубопровід встановлений і працює, ми матимемо безперервний потік даних, які тепер потребують переробки у корисні продукти.

Тепер, коли ми маємо ці сирі дані, їх цінність обмежена. Їх потрібно очистити.

Перше, що ми робимо — це проектуємо репозиторій у факти, таблиці пошуку та виміри. Це як очищення чи перегонка сирої нафти в базові форми, як моторне масло, бензин і авіаційне паливо з залишками, такими як космолін, вазелін і, на жаль, їжа.

Якщо у вас є ресторан з додатком і ви пропонуєте чудові акції для користувачів, можливо, ви створили магазин, щоб зчитувати всі дані, коли вони приходять: скільки часу вони провели в черзі, які інгредієнти вибрали, яке блюдо, касир, метод оплати, зупинка біля автомата для газованої води, газована вода та будь-які добавки. Зараз це неорганізовано і потребує сортування в правильну коробку.

Усі компоненти, що входять у відвідування, завантажуються в таблиці, які посилаються на коди в таблиці, що містить факти візиту. Компоненти, як інгредієнти, клієнт, працівник, продукти харчування. Ми називаємо це вимірами.

Усі зустрічі — це факти, де час і дата завантажуються в коробку (таблицю) і мають коди, що посилаються на все, що знаходиться у вимірі або таблиці пошуку.

Таблиця пошуку — це дані, які нам потрібні для ідентифікації речей у вимірах, таких як поштові індекси для пошуку міст і штатів, наприклад.

Коли ви маєте всі ці елементи на своїх місцях, ви можете створювати такі речі, як інформаційні панелі, звіти, аналітику та прогностичну аналітику.

Інформаційна панель може показати вам все, що відбувається на цей момент. Не дуже корисно, якщо вам не потрібно викликати додаткових працівників або купити більше м'яса, але якщо ви були компанією доставки з сотнею вантажівок на дорозі, ви б одразу дізналися, якщо відбудеться подія "перешкода на дорозі", яка вимагатиме, щоб ви надіслали ще одну заповнену чи порожню вантажівку на певне місце.

Звіт — це просто, скільки клієнтів і обслугованих страв я мав учора або в інший день чи період часу.

Аналітика може бути такою, як виробництво відходів, але цінні продукти, як використане масло, компост, або харчові відходи.
text
Моя компанія використовує обчислення на основі даних, щоб зрозуміти, чому один день був більш прибутковим за інший, або чому було так мало покупок у день, коли всі мали б активно купувати, а також для багатьох інших ситуацій, які потребує бізнес.

Прогностична аналітика дозволяє знати, в межах розумного допуску, що має бути завантажено, доставлено, продано та повернуто кожного дня. Ці обчислення важать свою вагу в золото, тому що ви будете отримувати найбільший прибуток, витрачаючи найменше на запаси і витрати. З іншого боку, ви будете знати, коли купити стільки товару, скільки вам потрібно, тому що він закінчився, і отримати не більше того, що було в запасах.

Сподіваюся, я описав це достатньо чітко.

Основні аспекти:

Якість даних: Забезпечення точності, повноти та узгодженості даних є важливим для надійних результатів.

Безпека та конфіденційність даних: Захист чутливих даних від несанкціонованого доступу та зловживань є найважливішим.

Управління даними: Встановлення чітких політик та процедур для збору, використання та обміну даними.

Етичні міркування: Використання даних відповідально та етично, з повагою до приватності осіб і без упередженості.

По суті, "очищення" даних — це багатокроковий процес, що перетворює сирі дані на дієву інформацію і цінні інсайти. Це вимагає поєднання технічної експертизи, аналітичних навичок і глибокого розуміння бізнес-галузі.

Фактично, "очищення" даних передбачає багатокроковий процес, який перетворює сирі дані на дієву інформацію і цінні інсайти. Це вимагає поєднання технічної експертизи, аналітичних навичок і глибокого розуміння вашого бізнесу. Тут немає місця для загальних бізнес-питань. Ви повинні чітко розуміти, що саме ви шукаєте. Витрати та час для налаштування цього процесу значні.

Це чудово корелює з терміном "Дані — нова нафта".

Чи цікавить вас такий тип очищення?

Зв'яжіться з Вільямом Дж. Рітшоттом II за номером 603–860–3331.

Основний профіль Linked In — https://www.linkedin.com/in/williamritchotte/

NH Advanced Database Technology — https://www.linkedin.com/company/nh-advanced-database-technology

Перекладено з: Data Is The New Oil

Leave a Reply

Your email address will not be published. Required fields are marked *