Будування API з високою пропускною здатністю для обробки мільйонів подій у реальному часі - javascript.org.ua

У світі сучасних застосунків ведення журналів (logging) є не лише необхідністю, але й важливою складовою моніторингу, налагодження (debugging) та аналізу поведінки системи. Але що, якщо ваша система повинна обробляти мільйони подій журналів на годину з різних джерел в реальному часі? Як створити API, який здатний ефективно обробляти такі високонавантажені завдання, не компрометуючи масштабованість, збереження даних та продуктивність?

У цій статті ми розглянемо архітектуру та технології, які використовуються для створення API високої пропускної здатності, здатного обробляти мільйони подій кожну годину. Ми зосередимося на масштабованості, стійкості, економічності та оптимізації продуктивності, використовуючи безсерверні технології AWS.

Виклики при проектуванні API високої пропускної здатності для ведення журналів

Перед тим, як зануритися в архітектуру, давайте розглянемо основні виклики, які потрібно вирішити:

Великий обсяг одночасних запитів: Система повинна ефективно обробляти мільйони запитів на секунду.
Збереження даних: Події не повинні губитися, навіть у разі збоїв системи.
Масштабованість: Коли трафік зростає, система повинна масштабуватися без ручного втручання.
Продуктивність: Система повинна підтримувати низьку затримку для відповідей API та запитів аналітики.
Стійкість: Система повинна бути стійкою до часткових збоїв (наприклад, проблеми з базою даних або тайм-аути мережі).

Для досягнення цих цілей можна скористатися безсерверними послугами AWS, що дає гнучкість, масштабованість і економічність.

Опис архітектури: Основні компоненти

Систему можна розділити на кілька компонентів, кожен з яких розроблений для вирішення конкретних завдань. Давайте детально розглянемо ці компоненти.

1. Обробка запитів з високим обсягом одночасних підключень

Для ефективного прийому мільйонів подій журналу, API Gateway служить точкою входу для всіх вхідних запитів. API Gateway автоматично масштабується залежно від трафіку, тому вам не потрібно турбуватися про управління потужностями.

Коли запит надходить до API Gateway, AWS Lambda бере на себе обробку. Функції Lambda запускаються асинхронно для обробки кожної події журналу. Оскільки Lambda масштабується автоматично, вона може одночасно обробляти великий обсяг запитів, не турбуючись про розгортання серверів.

API Gateway: Легко обробляє мільйони одночасних HTTP-запитів.
AWS Lambda: Масштабується залежно від попиту та обробляє події асинхронно.

2. Ефективне проектування зберігання журналів

Події журналу потрібно зберігати в масштабованій, низькозатримуваній базі даних. Для цього використовуємо Amazon DynamoDB.

DynamoDB — це повністю керована NoSQL база даних, яка безперешкодно масштабується для обробки мільйонів записів журналів. Базу даних проектуємо таким чином:

Ключ розподілу: event_id (Забезпечує унікальність)
Ключ сортування: timestamp (Дозволяє ефективно запитувати за часом)

Крім того, можна використовувати DynamoDB Streams, щоб ініціювати подальші процеси, наприклад, передавати дані журналів до Elasticsearch для реального часу запитів і аналітики.

3. Обробка пікових навантажень без втрат даних

Під час пікових навантажень дуже важливо забезпечити, щоб жодні журнали не були втрачені. Тут Amazon SQS виступає в ролі буфера між шаром прийому (API Gateway + Lambda) і подальшими сервісами (DynamoDB і Elasticsearch).

SQS чергує вхідні події під час пікових навантажень, забезпечуючи їх обробку без втрат.
Функції Lambda можуть обробляти повідомлення з SQS пакетами, забезпечуючи ефективну обробку навіть під час піків.

4. Стійкість і відмовостійкість

Жодна система не є ідеальною, тому важливо створювати стійкість для обробки збоїв.
AWS надає кілька інструментів для цього:

Lambda Retry Logic: Якщо подія журналу не може бути оброблена (через мережеві проблеми або тайм-аути), AWS Lambda автоматично повторює операцію.
Dead Letter Queue (DLQ): Необроблені журнали, які не вдалося обробити після спроб повтору, переміщуються в DLQ для подальшого огляду та повторної обробки.
Розгортання в кількох AZ і регіонах: DynamoDB і Elasticsearch можуть бути розгорнуті в кількох зонах доступності (AZ) для забезпечення високої доступності та відмовостійкості.
Point-in-Time Recovery (PITR): У разі випадкового видалення даних, PITR гарантує, що дані можна відновити.

5. Оптимізація продуктивності

Для системи ведення журналів з високою пропускною здатністю продуктивність є ключовим фактором. Ось як ми можемо її оптимізувати:

Lambda Batching: Замість обробки кожної події журналу окремо, Lambda обробляє події пакетами, знижуючи накладні витрати і покращуючи час виконання.
Elasticsearch/OpenSearch: Використовується для реального часу запитів та аналітики збережених даних журналів. Індексуючи журнали в Elasticsearch, ми можемо виконувати швидкий пошук та агрегацію по великих наборах даних.
API Gateway: Забезпечує обробку запитів API з високим обсягом з низькою затримкою.

6. Оптимізація витрат

Безсерверні сервіси AWS за замовчуванням є економічними, оскільки ви платите лише за фактичне використання. Проте є додаткові способи оптимізувати витрати:

DynamoDB: Використовуйте Provisioned Capacity для передбачуваних навантажень та On-Demand Capacity для пікових періодів. Також увімкніть TTL (Time-to-Live) для журналів, які більше не потрібні після певного періоду.
Elasticsearch: Використовуйте архітектуру hot-warm, де нові журнали зберігаються на швидких SSD-нодах (hot), а старі журнали переміщуються в дешевше зберігання (warm) на Amazon S3.
Lambda: Оскільки Lambda стягує оплату лише за фактичний час виконання, пакетна обробка і оптимізація функції для мінімізації часу виконання знижує загальні витрати.

Висновок

Проектування API високої пропускної здатності для ведення мільйонів подій потребує ретельного вибору інструментів та стратегій. Використовуючи безсерверні технології AWS, такі як API Gateway, AWS Lambda, DynamoDB, SQS та Elasticsearch, ви можете побудувати систему, яка легко масштабується, обробляє великі пікові навантаження та забезпечує збереження даних і стійкість.

Ця архітектура надає масштабоване, стійке та економічне рішення для сучасних потреб ведення журналів, ідеально підходить для застосунків, які потребують аналітики в реальному часі та високої пропускної здатності з мінімальною затримкою.

Остаточні думки

Ключ до проектування масштабованих і стійких систем — це використання хмарних рішень, таких як AWS, які автоматично обробляють масштабування та надійність. Орієнтуючись на безсерверні технології, ви можете створювати рішення, які не тільки масштабується, але й залишаються економічними, задовольняючи вимоги сучасних застосунків.

Якщо ви створюєте систему, яка повинна обробляти мільйони подій журналів, розгляньте можливість використання безсерверного стека AWS. Це може спростити вашу архітектуру, знизити операційні витрати і полегшити зосередження уваги на наданні цінності для ваших користувачів.

Перекладено з: Building a High-Throughput API for Logging Millions of Events in Real-Time