Ідея передових автономних систем, які зазвичай називаються AI агентами, часто викликає образи футуристичних роботів, здатних управляти всім — від інвентаризації на фабриці до вашого тижневого списку покупок. Але за лаштунками витрати на AI агентів часто затіняються гучними заголовками про прориви в галузі генеративного AI. Створення таких систем може бути вкрай ресурсомістким. Справа не тільки в тренуванні великої мовної моделі на масивних наборах даних; AI агенти повинні бути інтегровані в складні середовища, адаптуватися до реальних змін в реальному часі та часто виконувати кілька спеціалізованих завдань одночасно.
Подумайте про інфраструктуру, яку вони вимагають. По-перше, є значна ціна хмарних обчислень і спеціалізованого обладнання, такого як GPU або TPU, які здатні обробляти мільярди операцій на секунду. Далі йде резерв талантів: високо кваліфіковані AI дослідники та інженери, деякі з яких отримують зарплати, що значно перевищують верхні рівні типових технічних посад. Останні оцінки свідчать, що деякі AI проєкти оцінюються в багатомільярдному діапазоні. Наприклад, ініціатива Google Gemini обійшлася компанії в близько $191 мільйонів на побудову та тренування, тоді як GPT-4 від OpenAI, за повідомленнями, коштував майже сто мільйонів доларів на створення та розгортання. Є припущення, що GPT-5 може коштувати OpenAI до мільярда доларів на побудову, оскільки вартість його тренування вже досягла півмільярда доларів. Якщо ви ще не знали, GPT-5 вважається провідним AI агентом на ринку після його виходу, але інші моделі AI, які спочатку були генеративними AI, тепер стали AI агентами, такими як Llama від Meta і Claude від Anthropic. Ці вражаючі цифри лише натякають на складність кінцевих AI агентів, систем, створених не лише для генерації тексту чи зображень, а й для виконання автономного прийняття рішень в динамічних середовищах.
AI агенти також вимагають безперервного циклу зворотного зв'язку, отримуючи нові дані в реальному часі для коригування своїх дій. Цей безперервний апетит до реального введення даних і обчислювальної потужності підвищує витрати та натякає, що створення AI агентів може, в багатьох випадках, перевищити витрати на створення генеративних AI моделей.
Вартість побудови AI моделей | Джерело: Epoch
Чи зростаючі витрати розширять технологічний розрив?
З точки зору менших гравців на технологічному ринку, зростаючі ціни на розробку AI викликають серйозні побоювання. Вартість AI агентів стала стратегічним питанням для стартапів та середніх компаній, які намагаються конкурувати з великими корпораціями, такими як Google, Microsoft і Meta. Ці технологічні гіганти можуть значно інвестувати в інфраструктуру та таланти, гарантуючи, що вони залишаються на передовій. Крім того, вони можуть дозволити собі ризикувати та навіть понести збитки на своїй ринковій капіталізації, як це сталося з Google, чия ринкова вартість після запуску Gemini втратила $70 мільярдів через скандал, пов'язаний з релізом. З іншого боку, менші компанії часто покладаються на венчурний капітал або оренду хмарних ресурсів для обчислень — обидва ці варіанти можуть раптово зростати в ціні, як тільки проєкт набирає обертів.
Цей потенційний розрив ризикує створити середовище, де лише найбільші корпорації можуть дозволити собі просувати межі інновацій, що базуються на AI. Однак не всі ознаки вказують на катастрофу: ініціативи з відкритим кодом і дослідницькі центри надають деяку надію на демократизацію цієї галузі.
З організаціями, такими як Hugging Face, EleutherAI та різними університетськими лабораторіями, що надають безкоштовні або недорогі моделі та набори даних, менші гравці можуть швидко розпочати свої амбіції в AI без необхідності витрачати мільйони на початкових етапах.
Проте реальність є суворою. Високі витрати на обчислення, великі зарплати для провідних AI вчених і зростаючі операційні витрати означають, що менші підприємства можуть виявитися постійно позаду. Це може призвести до майбутнього, в якому кілька великих компаній домінуватимуть у дослідженнях в галузі AI, придушуючи здорову конкуренцію, яка породжує нові ідеї.
Джерело: McKinsey
Як зробити AI агентів більш доступними
На перший погляд, концепція повністю автономного AI агента, здатного планувати, виконувати завдання та навчатися на ходу, здається такою, що належить виключно до технологічних гігантів з великими коштами. Однак існує багато стратегій, які допомагають меншим організаціям взяти на себе цей виклик без втрати амбіцій.
Фреймворки з відкритим кодом, такі як TensorFlow, PyTorch і Hugging Face Transformers, є рятівною лінією для менших команд, пропонуючи потужні моделі та інструменти за мінімальну або відсутню вартість. Налаштовуючи лише останні шари для специфічних потреб домену, ці організації значно зменшують вимоги до обчислювальних потужностей. Модульні архітектури, які ділять AI агентів на "підагентів", підвищують ефективність, дозволяючи кожному модулю вдосконалюватися окремо. Тим часом, федеративні підходи та дослідницькі консорціуми об'єднують ресурси, такі як обладнання, дані та спеціалізовані таланти, що допомагає будувати AI агентів набагато дешевше в галузях, які мають спільні виклики.
Традиційні методи оптимізації, такі як обрізка, квантизація та дистиляція, також полегшують тягар. Ці техніки скорочують моделі без шкоди для продуктивності, знижуючи як обчислювальні витрати, так і витрати. Більш сфокусовані, специфічні для домену агенти не потребують такого масштабу, як системи загального призначення, що ще більше знижує витрати. Важливо, що різноманітна екосистема AI, підтримувана грантами, партнерствами та академічною співпрацею, забезпечує, що стартапи та менші лабораторії не залишаються осторонь. І з новими дослідженнями енергоефективних обчислень, включаючи апроксимовані обчислення, які пропускають повну точність, коли це не потрібно, високі витрати на побудову AI агентів можуть знизитися ще більше. Іноді справа не в тому, щоб вкладати гроші в більші моделі, а в тому, щоб розумно інженерити.
Створення справді доступних AI агентів вимагатиме поєднання цих стратегій, постійної ітерації та готовності як публічних, так і приватних акторів знижувати бар'єри. У своїй основі технології процвітають завдяки різноманітності — ідей, ресурсів і учасників. Забезпечення того, щоб менші гравці могли залишатися активними учасниками, не тільки сприяє етичній справі, але й рухає всю галузь вперед. Вартість AI агентів не повинна бути непереборною перешкодою, поки інноватори продовжують знаходити нові способи розподіляти навантаження та удосконалювати науку за кодом.
Але ось сувора правда: конкуренція може бути жорсткою, і ймовірно, що більші компанії приховають свої секрети створення дешевших і більш ефективних AI агентів. Якщо це станеться, ми можемо опинитися в майбутньому, де створення AI, його методи, прориви та переваги стануть заблокованим скарбом, контрольованим кількома корпоративними гігантами. Це означатиме не лише розширення технологічного розриву, але й фундаментальні зміни в тому, хто тримає в руках ключі до прогресу людства. І історія показала, що коли кілька осіб володіють усіма ключами, це рідко закінчується добре для решти з нас.
Exponential Era — ваш джерело контенту про все, що стосується Web3 на Medium, підтримуваний Epik.
Epik — провідне агентство з ліцензування інтелектуальної власності в світі, експерт у Web3, AI, Metaverse та провідне агентство для інтеграції брендів у відеоігри, що використовує найбільшу цифрову екосистему та передову технологію крос-ланцюгів.
Слідкуйте за нашими соціальними мережами, щоб бути в курсі останніх новин та розробок щодо партнерств і співпраці. Telegram, Twitter, Instagram,YouTube, та Офіційний вебсайт_.
Перекладено з: The Expense of Building AI Agents