Цього року я записався на програму сертифікації з прикладного генеративного ШІ в університеті Джонса Хопкінса, яку проводять у партнерстві з Great Learning. Мене не цікавив ще один простий буткемп або серія пояснень, я хотів зрозуміти суть ШІ-систем і створити щось реальне.
Я працюю в Dow Jones в секторі нових продажів, де консультував клієнтів по таких темах, як ризик і комплаєнс, аналіз новин у реальному часі та машинночитні потоки для аналітики портфоліо та прогнозного моделювання. Я бачив, як генеративний ШІ змінює фінансові робочі процеси — від автоматизованих ринкових інсайтів до виявлення порушень комплаєнсу. Але я не хотів просто говорити про ШІ, я хотів його зрозуміти, програмувати, відлагоджувати і застосовувати.
Тепер, коли я глибоко занурений у курс, моя чесна думка: це варто того, але не для всіх.
Хто не підходить для цієї програми
Якщо ви вже старший дата-сайентіст або інженер, цей курс може здатися занадто базовим. І якщо вам не цікаво вчитися Python або використовувати Google Colab для розробки своїх проєктів, ви навряд чи отримаєте багато користі.
Цей курс не безкодовий, і він не є поверхневим.
Він підходить для людей середнього рівня — професіоналів, аналітиків, лідерів продуктів і зацікавлених розробників, які хочуть стати технічними, вчитися через практику і почати створювати.
Чому це спрацювало для мене
Структура цього курсу — ось що робить його ефективним. Це не лише лекції. Це:
- Щотижневі приклади кодування на Python.
- Керовані робочі процеси для LLM, агентів та розробки запитів.
- Менторство від викладачів з академічним і промисловим досвідом.
- Навчання через проєкти з реальними інструментами, такими як LangChain і LangGraph.
Ось як побудований курс:
Тижні 1-2: Основи + Python для генеративного ШІ
Перші два тижні закладають основи:
- Тиждень 1: Вивчення генеративних і дискримінативних моделей, векторних ембеддингів та основ архітектури трансформерів.
- Тиждень 2: Ви починаєте програмувати на Python. Це не просто копіювання — ви пишете скрипти, вчитеся відлагоджувати і інтегруєте ChatGPT як партнера по кодуванню.
Цей тиждень був корисний, адже багато учнів стикаються не тільки з теорією, але й з абстрактною логікою, синтаксичними помилками та страхом почати. Цей тиждень допомагає подолати ці труднощі.
Тиждень 3: Реальний ШІ з кейс-стаді USPS
Ми вирішували задачу обробки понад 300 000 неправильних адрес для поштових тестових наборів на COVID. Основні висновки:
- Навіть експерти не могли дійти згоди щодо класифікації.
- Моделі NLP, як Random Forest і Neural Networks, показали кращі результати ніж ручний перегляд.
- Використання регулярних виразів та стандартизація адрес значно покращили точність.
Це продемонструвало, як ШІ може допомогти у прийнятті рішень у складних, неоднозначних системах.
Тиждень 4: Машинне навчання з даними про якість вина
Тут ми створювали наші перші класифікатори:
- SVM, дерева рішень, випадковий ліс, наївний Байєс тощо.
- Тренували моделі на реальних даних про якість вина — не збалансованих і шумних.
Ми вивчали, як вибір моделі, якість даних і попередня обробка впливають на результат. Поняття узагальнення і переоснащення стали реальними і вимірюваними.
Тижні 5-6: NLP + LLM
Ми досліджували весь стек технологій, від мішка слів до GPT.
Основні висновки:
- Попередня обробка важлива: токенізація, видалення стоп-слів і лематизація — основа.
- LLM, такі як GPT-4, можуть працювати zero-shot, але це має свої ризики.
- Трансформери змінили NLP, дозволяючи швидко обробляти дані завдяки паралелізації.
Тиждень 7: Розробка запитів
Цього тижня ми вивчали, як правильно комунікувати з моделями. Це не лише отримання відповідей, але й важливість чітких інструкцій, персон, прикладів, роздільників і оцінки вихідних даних на узгодженість.
Проєктування запитів стало невід'ємною частиною самого процесу створення, а не лише введення даних.
Тиждень 8: Класифікація тексту з генеративним ШІ
З LLM можна класифікувати текст навіть без прикладів або з дуже малою кількістю. LLM краще справляються з нюансами, ніж старі моделі, і надають пояснення, а не просто маркування.
Тижні 11-13: Відповідальний та агентний ШІ
Це найбільш впливовий етап курсу. Ми вивчали реальні приклади, як відсутність належного контролю, інтерпретації або заходів безпеки призвела до трагедій. З’ясували основні принципи F.A.I.R.S.T.:
- Чесність, Відповідальність, Цілісність, Міцність, Безпека, Довіра.
У 12 тижні ми почали створювати автономних агентів за допомогою LangGraph. Це стало основою для мого проєкту — бота для аналізу акцій на Python, який здатен отримувати дані через API Alpaca, використовувати LLM для виявлення трендів та пропонувати автоматичні наступні кроки.
Вартість програми
- $2950 загалом з двома варіантами знижок:
- $150 за повну оплату
- $150 стипендія
Фінальна ціна після знижок: $2650
Це не дешево, але для програми, яка триває три місяці і дає реальні результати, це цілком справедлива інвестиція, особливо якщо ваше місце роботи підтримує навчання.
Остаточні думки
Якщо ви професіонал, який хоче стати більш технічним, або учень, який хоче зрозуміти, як працює ШІ, а не лише що він може робити, цей курс підійде вам.
Але це не панацея. Вам потрібно буде:
- Програмувати
- Вчити Python
- Виправляти помилки
- Використовувати Google Colab щотижня
- Критично ставитись до етики ШІ
Якщо ви готові до цього, курс допоможе вам вийти на новий рівень у кар'єрі. І якщо ви готові будувати, я рекомендую цей курс.
Якщо хочете побачити бота для аналізу акцій, над яким я працюю, або просто поговорити про те, чи підходить цей курс для ваших цілей, звертайтеся.
Перекладено з: Why the “AI Scientist” Changes Everything