Интерактивный онлайн-семинар по архитектуре RAG
Основная концепция, архитектура, компоненты RAG системы
Методы эмбеддингов, Sentence Transformers, модели
FAISS, HNSW, Annoy - сравнение алгоритмов
Recall@k, Precision@k, оценка RAG систем
Базовый RAG-конвейер, примеры кода
Интеграция с YandexGPT, эмбеддинги, API
RAG (Retrieval-Augmented Generation) — гибридная архитектура, объединяющая механизмы поиска с генеративными языковыми моделями.
Проблема:
LLM склонны к галлюцинациям и не имеют доступа к актуальной информации
Решение:
Внешние источники знаний + генеративная модель = точные и обоснованные ответы
документы → чанки → эмбеддинги → векторная БД
запрос → поиск → контекст → LLM → ответ
| Алгоритм | Скорость | Память | Точность | Сжатие | GPU |
|---|---|---|---|---|---|
| HNSW | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ❌ | ❌ |
| FAISS | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ | ✅ |
| Annoy | ⭐⭐ | ⭐⭐ | ⭐⭐⭐ | ❌ | ❌ |
Hierarchical Navigable Small World
Facebook AI Similarity Search
Approximate Nearest neighbors Oh Yeah
Доля релевантных документов среди топ-k результатов
Точность среди топ-k результатов
Mean Reciprocal Rank - обратный ранг первого релевантного результата
Релевантность ответа запросу
Отсутствие галлюцинаций относительно контекста
Релевантность извлеченного контекста
💡 Совет: Измените код ниже и нажмите "Запустить" для экспериментов!
Проверьте, насколько хорошо вы усвоили материал семинара. 5 вопросов о ключевых концепциях RAG.
Лучший выбор для сложных RAG задач с длинным контекстом
Сбалансированное решение для большинства RAG применений
Быстрые ответы для простых RAG запросов
Начало работы с Yandex Foundation Models:
pip install yandexcloudВы изучили основы RAG технологии и готовы применить знания на практике
Спасибо за участие в семинаре! Удачи в изучении RAG технологий 🚀