Початок шляху в автоматизацію та штучні інтелектуальні агенти: Моя подорож і уроки, які я засвоїв - javascript.org.ua

Чи відчували ви коли-небудь цей потяг взяти вашу пристрасть до автоматизації та агентів ШІ і вийти за межі простого туторіалу "Hello, World!"? Я був саме таким не так давно. Мене завжди захоплювало, як технології можуть виконувати нудну рутину, але я не знав, з чого почати — поки не занурився в створення своїх перших додатків на основі агентів. Сьогодні я хочу поділитися деякими особистими висновками і показати код, з якого я почав.

Чому автоматизація? Чому агенти?

Для мене автоматизація завжди була про відновлення часу і можливість зосередитися на більш стратегічних або творчих завданнях.
Чи то ви самотній підприємець, допитливий аматор, чи просто той, хто хоче зменшити кількість повторюваних завдань, інструменти автоматизації та агенти ШІ можуть виконати важку роботу за вас — збір даних, аналіз акцій, пошук в Інтернеті, ви тільки скажіть.

Агент в цьому контексті — це просто програма, створена для виконання конкретного завдання від вашого імені — наприклад, аналізу фінансових даних або пошуку найкращого рецепту веганської піци в Інтернеті. Це не роботи зі sci-fi, що працюють у лабораторії, але ефект може бути не менш магічним.

Мій перший справжній крок: зв'язок інструментів та агентів

Коли я починав, найбільшим бар'єром було зрозуміти, як все інтегрувати: від великої мовної моделі (LLM) до зовнішніх інструментів, таких як Yahoo Finance або веб-пошук. Я відкрив Phi framework — чудову колекцію бібліотек Python, які допомагають швидко створювати, комбінувати і керувати агентами ШІ.

Ось базова ідея моєї налаштування:

Агенти: “приймають рішення”, які знають, як спілкуватися з моделями.
2.
Моделі: Інтелект, що працює за лаштунками, наприклад, Groq або будь-яка велика мовна модель (LLM), яка може розуміти та генерувати текст.
Інструменти: Реальні "руки" та "ноги" агента (наприклад, пошук в Інтернеті або отримання котирувань акцій з Yahoo Finance).

Код: Як все об'єднати

Нижче наведено спрощену версію коду, який я написав. Він налаштовує два агенти: один для пошуку в Інтернеті та один для фінансових запитів (наприклад, котирування акцій та рекомендації аналітиків).
Тоді запускається додаток Playground, який є мінімальним веб-інтерфейсом для взаємодії з цими агентами.

from phi.agent import Agent  
from phi.model.groq import Groq  
from phi.tools.yfinance import YFinanceTools  
from phi.tools.duckduckgo import DuckDuckGo  
import phi.api  
import os  
from phi.playground import Playground, serve_playground_app  
from dotenv import load_dotenv  

# Завантаження змінних середовища  
load_dotenv()  
phi.api_key = os.getenv('PHI_API_KEY')  

### Агент пошуку в Інтернеті ###  
web_search_agent = Agent(  
 name='web search agent',  
 description='Шукає інформацію в Інтернеті',  
 model=Groq(id="mixtral-8x7b-32768"),  
 tools=[DuckDuckGo()],  
 show_tool_calls=True,  
 markdown=True  
)  

### Фінансовий агент ###  
finance_agent = Agent(  
 name='finance agent',  
 model=Groq(id="mixtral-8x7b-32768"),  
 tools=[YFinanceTools(  
 stock_price=True,  
 analyst_recommendations=True,  
 stock_fundamentals=True,  
 company_news=True  
 )],  
 show_tool_calls=True,  
 description="Ви є інвестиційним аналітиком, який досліджує котирування акцій, рекомендації аналітиків і фінансові показники компаній.",  
 instructions=["Форматуйте відповідь за допомогою markdown і використовуйте таблиці для відображення даних, де це можливо."],  
 markdown=True  
)  

# Створення додатку Playground  
app = Playground(agents=[finance_agent, web_search_agent]).get_app()  

if __name__ == '__main__':  
 serve_playground_app("playground:app", reload=True)

Як це працює

1.
Завантаження змінних середовища: За допомогою dotenv я завантажую секрети (наприклад, PHI_API_KEY) з файлу .env. Це є кращою практикою, щоб уникнути хардкодування чутливої інформації в коді.
2. Ініціалізація агентів:

Агент пошуку в Інтернеті, який використовує DuckDuckGo для отримання інформації онлайн.
Фінансовий агент, який запитує дані з Yahoo Finance щодо акцій, рекомендацій аналітиків, основних фінансових показників і новин компаній.

Налаштування Playground: Додаток Playground — це дуже зручний спосіб створити локальний інтерфейс, щоб тестувати агентів інтерактивно, не турбуючись про складнощі фронтенду.
Запуск додатку: Нарешті, я використовую serve_playground_app, щоб запустити локальний сервер з автооновленням. Це означає, що будь-які зміни в коді Python автоматично оновлюють працюючий сервер.

Мої уроки

1.
Не лякайтесь технічного жаргону: Термінологія на зразок “LLM,” “агенти” чи “проектування запитів” може здатися лякаючою. Як тільки ви зрозумієте, що кожен елемент має свою конкретну, вузьку функцію, все стає набагато зрозумілішим.
2. Використовуйте наявні інструменти: Не потрібно винаходити велосипед. Бібліотеки на кшталт phi дають вам старт, виконуючи більшу частину роботи за вас.
3. Безпека важлива: Зберігання ключів API в змінних середовища є основою для того, щоб ваші секрети залишались… секретами!
4. Документація — ваш друг: Офіційні документи або репозиторії на GitHub — це справжні скарби інформації (і фрагментів коду). Не бійтеся уважно їх читати.
5. Ітерації та експерименти: Починайте з малого. Тестуйте. Ламайте. Виправляйте. Повторюйте.
Я навчився більше на своїх помилках, ніж на правильних рішеннях з самого початку.

Куди йти далі

Якщо ви готові до розширення:

Додайте більше інструментів: Спробуйте підключити власний API або додати підтримку завдань обробки природної мови (NLP).
Інтеграція з фронтендом: Якщо ви знайомі з React чи Vue, ви можете підключити бекенд-агента до стильного фронтенду.
Розширення бізнес-використання: Агенти — це не тільки для особистих завдань! Вони також можуть виконувати повторювані, дані інтенсивні бізнес-задачі.

Останні думки

Перший крок до автоматизації з AI-агентами — це ніби відкриття магічного швейцарського ножа для ваших кодових проєктів. Це водночас захопливо і іноді лякає, але коли ви побачите, як ваш агент відповідає на реальні запити користувачів або отримує дані про акції в реальному часі, ви зрозумієте, яку потужність ви маєте всього лише в кількох рядках коду.

Сподіваюся, мій шлях — і цей маленький фрагмент коду — допоможуть розібратися в процесі.
Якщо вам цікаво, зробіть форк репозиторію Phi framework (або будь-якої бібліотеки, яка вам підходить) і почніть експериментувати. Ви ніколи не знаєте, яку неймовірну ідею для автоматизації чи агента ви вигадали наступною!

Дякую за те, що прочитали, і щасливої автоматизації!

Залишайтеся на зв'язку

Бажаєте дізнатися більше інсайтів та аналітики? Давайте продовжимо розмову! Зв'яжіться зі мною на LinkedIn для професійного контакту, слідкуйте за моїми оновленнями в галузі науки про дані та технологій на GitHub, і не пропустіть мої останні роздуми та проєкти.

Перекладено з: Stepping Into Automation and AI Agents: My Journey and Lessons Learned