Что такое Harness?

Про обвязку вокруг модели, без которой агент никуда не уедет

Павел Рыков

aka Pavel Zloi

история теория coddy вживую футурология

Блок 0 | Разогрев

Маршрут на сегодня

Что такое harness и при чём тут агенты
Откуда взялся термин
Какие бывают виды
Из чего собран внутри
Harness вживую - на примере моего Coddy
Уроки и грабли, что унести с собой
Футурология - harness мечты

Спойлер

Агент = LLM + Harness

Блок 1 | Что такое harness

Языковая модель умеет только: продолжать текст.

Не открывает файлысама по себе, у неё нет рук

Не запускает командынет доступа к shell и системе

Не помнит прошлый ходи с чистого листа, мы всё начнём сначала

Блок 1 | Что такое harness

Агент - это модель в цикле

Классический паттерн - ReAct (Reasoning + Action): думает, выбирает инструмент, получает результат, снова думает.

Блок 1 | Что такое harness

Почему цикл, а не один проход

0.99 ^ 10 ≈ 0.90

Закон Лессера (Lusser's law): надёжность последовательной цепочки равна произведению надёжностей звеньев.

Десять шагов по 99% дают на выходе около 90%. Система слабее слабого звена и с каждым шагом проседает сильнее. Без цикла, самопроверок и повторов модель на длинной задаче рассыпается.

Блок 1 | Что такое harness

Harness - вся обвязка вокруг модели

держит цикл
список инструментов
права доступа
историю сессии
связь с провайдером

Двигатель, машина и водитель

Модель - двигатель. Harness - всё остальное в машине, без чего двигатель крутится вхолостую. А промпт пользователя - водитель с маршрутом: решает, куда ехать.

Процессор, железо и ОС

LLM - процессор. Harness - материнка, память, диск и ввод-вывод вокруг него. А промпт пользователя - операционная система: задаёт, что и зачем считать.

Блок 1 | Что такое harness

Модель меняешь одной строкой в конфиге, а harness остаётся тот же.

Ценность не в конкретной модели, а в обвязке. Если ты не модель - ты harness © LangChain

Блок 2 | Откуда взялся термин

Слово появилось не вчера

Test harness

тестовый стенд вокруг кода. Термину десятки лет

Evaluation harness

lm-evaluation-harness, OpenAI Evals - прогон модели по задачам

Agent harness

OpenAI: SWE-bench, системные карты o1 и GPT-5 - обвязка ≠ модель

2026 - дисциплина

Anatomy of an Agent Harness: agent = model + harness

Блок 2 | Откуда взялся термин

Цена harness в чистом виде

TerminalBench 2.0: команда LangChain поднялась на +25 позиций, поменяв только обвязку. Модель не трогали.

Блок 2 | Откуда взялся термин

8 уровней агентной инженерии
(по мнению Bassim Eledath)

1 Tab Complete

2 Agent IDE

3 Context Engineering

4 Compounding Engineering

5 MCP и Skills

6 Harness Engineering

7 Background Agents

8 Автономные агентные команды

Блок 3 | Виды harness

Классификация harness'ов

По типу интерфейса

IDE-встройки (Cursor, Copilot, Zed)
CLI (Claude Code, Codex, Aider)
браузер и веб-UI
серверные боты

По транспорту

ACP - JSON-RPC поверх stdio (редактор ↔ агент)
HTTP - часто OpenAI-совместимый (агент как бэкенд)

По размещению

облачные managed (ключи и код во внешнем контуре)
self-hosted / on-premise (всё на вашей машине)

По рантайму

Node (Claude Code)
Python (большинство фреймворков)
один бинарник (Coddy на Go)

По циклу

простой ReAct
длинные петли в стиле Ralph

По числу агентов

одиночный (один цикл, один контекст)
мультиагент: Fork, Teammate, Worktree

Чистых типов нет - реальный harness миксует оси: Cursor - IDE + облако, Claude Code - CLI на Node, Coddy - один бинарник, сразу ACP и HTTP.

Блок 4 | Анатомия

Снимаем кожух

Системный промптроль и поведение агента

Инструментыфайлы, shell, веб + внешние через MCP

Цикл и стоп-условиясколько ходов, когда Stop, как ловит ошибки

Права и песочница

что можно трогать
режимы plan / agent
песочница: Docker → microVM → gVisor

МОДЕЛЬсменная деталь

Состояние и сессииистория ходов, чтобы помнил, что делал

Контекст и памятьчто в окне сейчас, а что в долгой памяти

Наблюдаемостьвиден каждый вызов, можно откатить

Skills + MCPтоже сменная деталь: навыки и внешние тулзы докидываются на ходу

Блок 4 | Анатомия

Почему части важны - в цифрах

−30%+

context rot: нужное в середине окна - качество проседает

−80%

в Vercel выкинули тулзы - и стало лучше. Скоупь инструменты

×2-3

цикл верификации поднимает качество в два-три раза

Блок 4 | Анатомия

Толщина harness

Тонкий

логика в модели

harness

Толстый

модель

логика снаружи, в harness

Леса убирают, когда здание готово: чем сильнее модель, тем тоньше harness. Но в ноль он не уходит.

Модель - сменная деталь. Всё остальное и есть harness.

Блок 5 | Harness вживую

Смотрим на живой harness

Подопытный - мой Coddy. Всё то же есть в Claude Code и Cursor, просто кнопки лежат в других местах.

Блок 5 | Harness вживую

Что показываю

Цикл и таймлайн вызовов: имя, аргументы, результат, время
Streaming, прерывание посреди ответа, восстановление сессии
Repair-loop: падающая задача чинится сама за пару попыток
Инструменты: файлы, shell, SSH на удалённый хост, веб-поиск

Режимы plan и agent - чем план безопаснее для разведки
Rules из .cursor и .claude подхватываются без правок
Skills как slash-команды: положил SKILL.md - команда в UI
Одна сессия в браузере и в редакторе через ACP
Тот же harness как OpenAI-бэкенд - обычным curl

Блок 5 | Harness вживую

Каждый вызов - имя, аргументы, результат. Тот самый цикл из блока 1, только вживую. Никакого чёрного ящика.

Блок 6 | Уроки и грабли

Обвязка важнее модели на длинной дистанции

Protocol-first побеждает

Контракт с первого дня - новые поверхности цепляются почти бесплатно.

Совместимость = юзеры

Читаешь чужие rules, даёшь OpenAI-API - человеку не надо переучиваться.

Общее состояние = дисциплина

Утечка деталей транспорта в общий слой ломает остальных. Слой состояния - самый консервативный.

Зрелая обвязка вокруг средней модели бьёт сырую обвязку вокруг топовой.

Блок 6 | Уроки и грабли

...и ещё грабли

Обвязка растёт как снежный ком

Каждая пойманная ошибка - новое правило в репозитории. Ком катится сам: чем дольше работаешь, тем надёжнее.

Потолок предсказуемости

Harness вывозит повторяемое, но не новое. В незнакомом сначала пройди руками сам.

Инструкции коротко, проверки строго

AGENTS.md ~100-150 строк. Линтеры с подробными сообщениями - учителя для агента.

Блок 7 | Что унести с собой

Не смотри со стороны - пощупай руками

Готовое из коробки

Claude Code, Codex, Cursor или Aider - и смотри на цикл и вызовы глазами.

Self-hosted в бинарник

Без рантайма - мой Coddy, ставится одной командой.

В любом случае

Дай простую задачу, подсунь свои rules, посмотри таймлайн. Там вся суть.

Минимум для старта: провайдер, модель, ключ - и агент уже отвечает. Глубже - каталог 80+ статей на Хабре.

Блок 8 | Футурология

harness мечты

Без обещаний и дорожных карт. Просто разгон - каким хочется видеть harness через пару лет.

Блок 8 | Футурология

Одна сессия - любой агент

Начал в Claude Code → продолжил в Codex → закончил в Coddy.
Общий формат сессий - и любой агент дочитывает чужую историю и генерит дальше.

Блок 8 | Футурология

Одна сессия - любое устройство

Запустил с компа → по дороге смотришь с телефона → вечером продолжил за столом. Устройство меняешь, сессия одна.

* VNC внутри туннеля до дома - пока что самое простое решение

Блок 8 | Футурология

Несколько человек в одной сессии

Как Google Docs, только для агента: каждый видит один цикл, каждый может вмешаться.

Блок 8 | Футурология

Рой агентов из коробки

Агент сам решает: хватит одной синхронной сессии - или поднять рой и раскидать задачу по параллельным агентам.

Простая задача

одна сессия, один контекст - синхронно, как сейчас. Лишних агентов не плодим.

Большая задача

harness сам форкается в рой: несколько агентов параллельно, у каждого своё окно, потом сводят результат.

Не ты заранее выбираешь число агентов - harness решает это на лету под задачу.

Спасибо! Вопросы?

Coddy Agent

github.com/coddy-project/coddy-agent

Telegram · Pavel Zloi

t.me/evilfreelancer

⭐ Звёзды и PR приветствуются

Подписывайтесь на телегу — там разборы по harness

Маршрут на сегодня

Агент - это модель в цикле

Почему цикл, а не один проход

Harness - вся обвязка вокруг модели

Слово появилось не вчера

Цена harness в чистом виде

8 уровней агентной инженерии(по мнению Bassim Eledath)

Классификация harness'ов

Снимаем кожух

Почему части важны - в цифрах

Толщина harness

Смотрим на живой harness

Что показываю

...и ещё грабли

Не смотри со стороны - пощупай руками

harness мечты

Одна сессия - любой агент

Одна сессия - любое устройство

Несколько человек в одной сессии

Рой агентов из коробки

Спасибо! Вопросы?

8 уровней агентной инженерии
(по мнению Bassim Eledath)