Не создавайте агентов, создавайте навыки - Барри Чжан и Махеш Мураг, Anthropic

Вступление

Доброе утро, и спасибо, что пригласили нас снова. В прошлый раз, когда мы были здесь, мы все еще пытались понять, что вообще такое агент. Сегодня многие из нас используют агентов ежедневно. Но мы все еще замечаем пробелы. У агентов есть интеллект и возможности, но не всегда та экспертиза, которая нам нужна для реальной работы.

Я – Барри. Это Махеш. Мы создали навыки для агентов. В этом выступлении мы покажем вам, почему мы перестали создавать агентов и начали создавать навыки вместо этого.

Эволюция экосистемы агентов

Многое изменилось с нашего последнего выступления. MCP стал стандартом для подключения агентов. Claude Code – наш первый агент для программирования – был запущен для всего мира. Наш SDK для агентов Claude теперь предоставляет готового к продакшену агента прямо из коробки. У нас более зрелая экосистема, и мы движемся к новой парадигме для агентов.

Эта парадигма – более тесная связь между моделью и средой выполнения. Проще говоря, мы считаем, что код – это все, что нам нужно.

От специализированных агентов к универсальным

Раньше мы думали, что агенты в разных доменах будут выглядеть очень по-разному. Каждому потребуются свои инструменты и каркас, а это означает, что у нас будет отдельный агент для каждого случая использования, для каждого домена. Хотя кастомизация все еще важна для каждого домена, агент под капотом на самом деле более универсален, чем мы думали.

То, что мы поняли – код это не просто случай использования, а универсальный интерфейс к цифровому миру.

Claude Code как универсальный агент

После того, как мы создали Claude Code, мы поняли, что Claude Code на самом деле является агентом общего назначения. Подумайте о создании финансового отчета. Модель может вызвать API для получения данных и проведения исследования. Она может организовать эти данные в файловой системе. Она может проанализировать их с помощью Python, а затем синтезировать инсайты в старом формате файла – все через код.

Основной каркас может внезапно стать таким же тонким, как просто bash и файловая система, что отлично и действительно масштабируемо. Но мы очень быстро столкнулись с другой проблемой, и эта проблема – доменная экспертиза.

Проблема экспертизы

Вопрос: Кто вам нужен для заполнения налоговой декларации? Это будет Махеш – математический гений с IQ 300, или это будет Барри – опытный налоговый специалист?

Ответ: Я бы выбрал Барри каждый раз. Я не хочу, чтобы Махеш разбирался в налоговом кодексе 2025 года с первых принципов. Мне нужно последовательное выполнение от доменного эксперта.

Агенты сегодня очень похожи на Махеша. Они блестящие, но им не хватает экспертизы. Они могут делать больше медленно. Они могут делать удивительные вещи, когда вы действительно прилагаете усилия и даете правильное руководство, но им часто не хватает важного контекста заранее. Они не могут действительно хорошо впитывать вашу экспертизу, и они не учатся со временем.

Представляем навыки агентов (Agent Skills)

Вот почему мы создали навыки агентов. Навыки – это организованные коллекции файлов, которые упаковывают композируемые процедурные знания для агентов. Другими словами, это папки.

Эта простота преднамеренна. Мы хотим что-то, что любой – человек или агент – может создать и использовать, если у них есть компьютер. Они также работают с тем, что у вас уже есть. Вы можете версионировать их в Git, можете загрузить их в Google Drive, и можете заархивировать и поделиться с вашей командой.

Почему файлы?

Мы использовали файлы как примитив десятилетиями, и они нам нравятся. Так зачем менять сейчас? Благодаря этому навыки также могут включать множество скриптов в качестве инструментов.

Проблемы традиционных инструментов

У некоторых инструментов плохо написанные инструкции, они довольно неоднозначны
Когда модель испытывает трудности, она не может действительно внести изменения в инструмент
Проблема холодного старта – модель просто застревает
Инструменты всегда живут в контекстном окне

Код как решение

✅ Самодокументируемый
✅ Модифицируемый
✅ Может жить в файловой системе, пока действительно не понадобится
✅ Используется только когда нужен

Прогрессивное раскрытие навыков

На этом этапе навыки могут содержать много информации, и мы хотим защитить контекстное окно, чтобы мы могли вместить сотни навыков и сделать их действительно композируемыми. Вот почему навыки раскрываются прогрессивно.

Во время выполнения модели показываются только метаданные, просто чтобы указать, что у него есть навык. Когда агенту нужно использовать навык, он может прочитать остальную часть skill.md, которая содержит основную инструкцию и директорию для остальной части папки.

Типы навыков

Мы видели, что это разделяется на несколько различных типов навыков:

1. Фундаментальные навыки

Те, которые дают агентам новые общие возможности или специфические для домена возможности, которых у них не было раньше.

Навыки для документов – дают Claude возможность создавать и редактировать офисные документы профессионального качества
Навыки научных исследований (от Cadence) – анализ данных EHR и использование библиотек биоинформатики Python

2. Навыки от партнеров

Партнеры в экосистеме создают навыки, которые помогают Claude лучше работать с их собственным программным обеспечением и продуктами.

Browserbase – навык для инструмента автоматизации браузера Stagehand
Notion – множество навыков для глубокого исследования по рабочему пространству

3. Корпоративные навыки

Навыки, специфичные для компании и команды, созданные для организации.

Fortune 100 компании – организационные лучшие практики и внутреннее программное обеспечение
Команды по продуктивности разработчиков – стиль кода, лучшие практики для тысяч разработчиков

Наблюдаемые тренды

По мере роста этой экосистемы мы начали наблюдать несколько интересных трендов:

📈 Навыки становятся более сложными

Самый базовый навык сегодня все еще может быть файлом skill.md с некоторыми подсказками, но мы начинаем видеть навыки, которые упаковывают программное обеспечение, исполняемые файлы, бинарники, файлы, код, скрипты, ассеты и многое другое.

Многие навыки могут занять недели или месяцы для создания и поддержки.

🔗 Дополнение экосистемы MCP

Эта экосистема навыков дополняет существующую экосистему серверов MCP. Разработчики используют навыки, которые оркестрируют рабочие процессы из нескольких инструментов MCP.

MCP обеспечивает подключение к внешнему миру, в то время как навыки обеспечивают экспертизу.

👥 Навыки создаются нетехническими людьми

Мы видим навыки, которые создаются людьми, которые не являются техническими специалистами. Это люди в таких функциях, как финансы, рекрутинг, бухгалтерия, юриспруденция и многое другое.

Это ранняя валидация нашей идеи о том, что навыки помогают людям расширять агентов и делают их более доступными.

Новая архитектура общих агентов

Связывая все это вместе, вот как это вписывается в возникающую архитектуру общих агентов:

🔄 Цикл агента

Управляет внутренним контекстом модели и токенами

⚙️ Среда выполнения

Предоставляет файловую систему и возможность читать и писать код

🔌 Серверы MCP

Инструменты и данные из внешнего мира

📚 Библиотека навыков

Сотни или тысячи навыков, загружаемых во время выполнения

Сегодня предоставление агенту новой возможности в новом домене может просто включать оснащение его правильным набором серверов MCP и правильной библиотекой навыков.

Будущее навыков

Мы начинаем думать о некоторых открытых вопросах и областях, на которых мы хотим сосредоточиться:

🧪 Навыки как программное обеспечение

Мы хотим поддерживать создателей навыков, начав относиться к навыкам так, как мы относимся к программному обеспечению:

Тестирование и оценка
Лучший инструментарий для загрузки навыков
Измерение качества вывода агента

📦 Версионирование

По мере того, как навык развивается и результирующее поведение агента развивается, мы хотим, чтобы это четко отслеживалось и имело четкую линию преемственности с течением времени.

🔗 Зависимости

Мы хотели бы изучить навыки, которые могут явно зависеть от других навыков, серверов MCP, зависимостей и пакетов в среде агентов. Это сделает агентов намного более предсказуемыми в различных средах выполнения.

🤝 Обмен и распространение

Огромная часть ценности навыков будет исходить от обмена и распространения. Видение, которое нас больше всего волнует, – это видение коллективной и развивающейся базы знаний возможностей, которая курируется людьми и агентами внутри организации.

Растущая ценность экосистемы

По мере того, как эта экосистема развивается, накопительная ценность будет распространяться за пределы вашей организации в более широкое сообщество. Так же, как когда кто-то еще в мире создает сервер MCP, который делает вашего агента более полезным, навык, созданный кем-то другим в сообществе, поможет сделать ваших собственных агентов более способными, надежными и полезными.

🧠 Непрерывное обучение

Это видение развивающейся базы знаний становится еще более мощным, когда Claude начинает создавать эти навыки. Мы разработали навыки специально как конкретные шаги к непрерывному обучению.

День 1

Стандартизированный формат дает важную гарантию: все, что Claude записывает, может быть эффективно использовано будущей версией самого себя. Это делает обучение действительно переносимым.

По мере использования

Навыки делают концепцию памяти более осязаемой. Они захватывают только процедурные знания, которые Claude может использовать для конкретных задач.

Долгосрочно

Claude может мгновенно приобретать новые возможности, развивать их по мере необходимости, а затем отбрасывать те, которые становятся устаревшими.

Наша цель: Claude на 30-й день работы с вами должен быть намного лучше, чем Claude в первый день.

Аналогия с компьютерной индустрией

Мы завершим, сравнив стек агентов с тем, что мы уже видели в вычислительной технике:

🖥️ Модели ≈ Процессоры

Оба требуют массивных инвестиций и содержат огромный потенциал, но сами по себе полезны лишь настолько.

⚙️ Среда выполнения ≈ ОС

ОС сделала процессоры гораздо более ценными, оркестрируя процессы, ресурсы и данные. Среда выполнения агента начинает играть эту роль в ИИ.

📱 Навыки ≈ Приложения

Реальная ценность исходит от приложений. Миллионы разработчиков создали программное обеспечение, которое кодирует доменную экспертизу и уникальные точки зрения.

Именно здесь мы проявляем творчество и решаем конкретные проблемы для себя, друг для друга и для мира, просто помещая вещи в папку.

Заключение

Навыки – это только отправная точка. В заключение, мы думаем, что мы сейчас сходимся на этой общей архитектуре для общих агентов. Мы создали навыки как новую парадигму для доставки и обмена новыми возможностями.

🚀 Поэтому мы думаем, что пришло время перестать перестраивать агентов и начать создавать навыки вместо этого.

И если вы взволнованы этим, приходите работать с нами и начните создавать навыки сегодня. Спасибо!