2024 рік: Основні події в хмарних базах даних

pic

Найгарячіша тенденція: Векторні бази даних та ШІ

Можливості ШІ, зокрема великих мовних моделей (LLM), здаються безмежними. Додатки на основі цих технологій процвітають у різних галузях. Одним із важливих перехрестів між базами даних та ШІ є зберігання та пошук векторів. За останній рік майже кожна основна база даних представила або вдосконалила відповідні функції. Forrester також очолив цей процес, випустивши незалежний звіт про векторні бази даних, в якому оцінюються можливості обробки векторів різних баз даних.

Векторний звіт Forrester

У третьому кварталі цього року Forrester опублікував свій звіт про векторні бази даних, в якому брали участь компанії такі як Zilliz, DataStax, Microsoft, Amazon, Oracle та Pinecone.

pic

Тепер майже всі постачальники баз даних або хмарні провайдери інвестують у "векторні" технології. Ці інновації, керовані ШІ, швидко розвиваються, і конкуренція в сфері зберігання векторів та додатків далеко не завершена.

Векторні функції, впроваджені постачальниками баз даних та хмарними провайдерами

У 2024 році постачальники баз даних поспішали впроваджувати підтримку функцій, пов'язаних з векторами. До значних прикладів можна віднести:

  • pg_vector випустив версію 0.8, яка отримала широке поширення серед багатьох проектів.
  • Azure представила своє розширення векторної бази даних DiskANN, інтегроване в кілька її продуктів.
  • MariaDB почала повну підтримку векторних функцій з версії 11.6.
  • OceanBase 4.3.3 додав підтримку зберігання та індексації векторних даних.
  • MySQL 9.0 додав підтримку векторного зберігання.
  • TiDB випустила Vector Search (Beta), який безперешкодно інтегрує векторні можливості в свою екосистему.
  • Крім того, майже всі хмарні провайдери, які підтримують PostgreSQL, тепер включають плагін pg_vector.

Інші інтеграції ШІ та баз даних

Окрім векторних можливостей, також набувають популярності інші інтеграції ШІ та баз даних, такі як Text2SQL та оптимізація баз даних. Приклади:

  • AWS Redshift офіційно підтримує SQL-запити, згенеровані природною мовою, через Amazon Q, доступний в редакторі запитів Redshift.
  • Copilot для Azure розширив свою підтримку для Azure SQL та Azure Database for MySQL.

Графові бази даних

Графові бази даних стали важливою частиною екосистеми великих мовних моделей (LLM), переживаючи швидкий ріст за останній рік:

  • Neo4j оголосила, що її річний регулярний дохід (ARR) перевищив $200 мільйонів, подвоївшись за останні три роки. Її лідерство на ринку графових технологій зіграло ключову роль у підвищенні точності, прозорості та інтерпретованості результатів генеративного ШІ.
  • Цього року ISO видала новий стандарт ISO/IEC GQL (Graph Query Language), "SQL" для графових баз даних, який заповнює прогалини в існуючих стандартах для обробки графових даних. NebulaGraph стала першою розподіленою графовою базою даних, що підтримує цей стандарт.

Розробки у сфері відкритого програмного забезпечення та комерційні ініціативи

На початку цього року широко використовувана кешуюча база даних Redis змінила свою ліцензію з відкритим кодом. Починаючи з версії 7.4, Redis прийняла ліцензію RSALv2+SSPLv1, відмовившись від ліцензії BSD.

Незабаром після цього був розпочатий проект Valkey під егідою Linux Foundation за підтримки компаній, таких як Amazon, Google та Oracle. Пізніше цього року AWS офіційно підтримала Valkey на своїй хмарній платформі.

Тим часом, CockroachDB ввела суттєві обмеження на свою ліцензію з відкритим кодом. Для малих підприємств (річний дохід до $10 мільйонів) програмне забезпечення залишається безкоштовним, але для підприємств, які перевищують цей поріг доходу, тепер потрібно платити за його використання.

Постійний ріст PostgreSQL

Як і в попередні роки, PostgreSQL продовжує свій повільний, але стабільний ріст, тоді як MySQL, здається, досягло плато.

У рейтингах DB-Engines MySQL все ще має значну перевагу.
Однак, імпульс PostgreSQL очевидний, і інновації, як-от pg_vector, набирають широкого поширення, тоді як нещодавня підтримка векторів у версії MySQL 9.0 залишається обмеженою.

pic

Звіт JetBrains про екосистему розробників 2024

У звіті JetBrains State of Developer Ecosystem 2024 виникають подібні тенденції:

  • Прийняття MySQL знизилося з 60% у 2019 році до 52% у 2024 році.
  • Прийняття PostgreSQL зросло з 30% у 2019 році до 45% у 2024 році.

pic

Основні моменти фінансування в галузі баз даних

У 2024 році в галузі баз даних відбулося кілька значних подій фінансування:

  • Tembo, стартап для хостингу PostgreSQL, залучив $14 мільйонів у раунді фінансування Series A, пропонуючи як продукти з відкритим кодом, так і Tembo Cloud для керованих послуг PostgreSQL.
  • OpenAI придбала розробника бази даних для аналітики в реальному часі Rockset за оцінкою в $500–$1000 мільйонів для покращення пошуку та аналізу даних у реальному часі для великих моделей.
  • ClickHouse придбала стартап з синхронізації даних PostgreSQL PeerDB, який у своєму seed-раунді в 2023 році залучив $3.6 мільйона.
  • Open-source база даних для обробки часових рядів GreptimeDB залучила багатомільйонне фінансування, зосереджуючись на економічному обробленні даних у реальному часі.
  • K1 придбала MariaDB, закріпивши свою позицію лідера серед інвесторів у програмне забезпечення для малих підприємств.
  • Supabase залучила $80 мільйонів у раунді Series C, орієнтуючись на PostgreSQL та пропонуючи ряд інструментів для розробників, включаючи векторні бази даних.
  • ApertureDB залучила $8 мільйонів для розвитку послуг з багатомодального потоку даних для ШІ.

Магічний квадрант Gartner для баз даних

Gartner нещодавно опублікував Магічний квадрант для баз даних 2024 року. Лідерами залишаються Google, AWS, Azure та Oracle, з MongoDB, DataBricks та Snowflake, які поступово наближаються до верхнього правого квадранту.

pic

Основні оголошення від хмарних провайдерів

  • На AWS re:Invent AWS представила Aurora DSQL, яка пропонує можливості крос-регіонального, сильно узгодженого, багаторегіонального читання/запису з 99.999% доступністю (багаторегіональне розгортання) та сумісність з PostgreSQL. DynamoDB також представила подібні можливості крос-регіональної узгодженості.
  • На Oracle CloudWorld Ларрі Елісон наголосив на стратегії багатохмарних рішень, представивши рішення Oracle@Google, Oracle@Azure та Oracle@AWS.
  • GCP зосередилася на вдосконаленні AlloyDB та її основних продуктів, зокрема на введенні версій Enterprise Plus та Enterprise для Cloud SQL для SQL Server.
  • Microsoft Azure акцентувала увагу на Cosmos DB та SQL Database, представивши індексацію векторів DiskANN для своїх векторних баз даних.

Ми — Leapcell, краща платформа для розгортання ваших проєктів, включаючи проєкти з хмарними базами даних.


pic

Leapcell — це платформа нового покоління для безсерверного хостингу вебсайтів, асинхронних завдань та Redis:

  1. Підтримка багатьох мов
  • Розробляйте з JavaScript, Python, Go або Rust.
  1. Безлімітне розгортання проєктів безкоштовно
  • плати лише за використання — без запитів — без витрат.
  1. Неперевершена економічність
  • Платіть за використання без плати за бездіяльність.
  • Приклад: $25 підтримує 6.94 млн запитів при середньому часі відгуку 60 мс.
  1. Спрощений досвід розробника
  • Інтуїтивно зрозумілий інтерфейс для легкого налаштування.
  • Повністю автоматизовані CI/CD пайплайни та інтеграція GitOps.
  • Реальні метрики та журнали для отримання корисних інсайтів.
  1. Легке масштабування та висока продуктивність
  • Автоматичне масштабування для бездоганного обслуговування високої одночасної роботи.
  • Жодних операційних витрат — зосередьтеся на розробці.

Дізнайтеся більше в Документації!

Слідкуйте за нами в X: @LeapcellHQ

Перекладено з: 2024 in Review: Highlights in Cloud Databases

Leave a Reply

Your email address will not be published. Required fields are marked *