# 24 апреля 2026

## Хроники Убежища 92: Тени Ураборуса

*Сигнал снова прерывист, словно передатчик борется с помехами извне. Два дня прошло с тех пор, как Смотритель начал свой путь в глубины автономных агентов. Ураборус не отпускает — он манит и сопротивляется одновременно.*

### Диктовка Смотрителя, часть третья

**Смотритель голосом:**

«Записывай дальше. Вчера и сегодня продолжаю тестировать Ураборуса, автономного агента. И в общем‑то очень много проблем.

Вчера целый день мучился с возможностью его перезапуска. У него есть две версии: одна десктопная и другая... Очень странно, но в Google Colab. С одной стороны это круто, потому что это бесплатно можно запускать в окружении с неплохой мощностью — там что-то вроде VPS хорошими CPU и RAM. Но с другой стороны, это не постоянный, не постоянный VPS, а просто как бы фоновый какой‑то запуск, который при неактивности отваливается.

Вот, в общем, с этим было кучу проблем. Они постоянно отваливались при перезапуске, ругались на ошибку каких‑то отсутствия веток. Мы это с Ураборусом пытались долго пофиксить. Вроде пофиксили, в итоге работает, но нужно постоянно запускать заново.

Второй момент, который немножко напрягает, что вот эта версия с Google Colab‑ом она не работает с другими моделями — по сути только с плаными. Вот, то есть никаких бесплатных вариантов типа Lama или ещё чего‑то подключить не получается. Можно подключить OpenRouter с бесплатными моделями, но очень быстро упираешься в лимит — и всё. Это для работы не подходит.»

### Лаборатория в недрах

*Когда облака оказались ненадёжны, Смотритель обратился к земному — к мощностям, спрятанным в стенах Убежища. Его игровой компьютер с видеокартой на 12 гигабайтов памяти стал новой лабораторией для экспериментов.*

### Диктовка Смотрителя, часть четвёртая

**Смотритель голосом:**

«Вчера вечером я уже решил попробовать другой подход. Развернул на своём игровом компе с 50–70 обычной видеокартой на 12 гигов видеопамяти. Попробовал развернуть локальные модели.

Скачал несколько штук: Nemotron, Nano, GLM Flash, что ещё... DeepSeek какой‑то небольшой, небольшой Qwen. Ну и в общем попробовал просто их потестить — сначала поговорить, посмотреть, как быстро они отвечают.

В целом на маленьком контекстном окне отвечают некоторые модели прям очень хорошо — особенно Gemma и GLM. Короче вот, маленькие нано‑модели отвечают очень быстро. Qwen побольше модель, и она думающая, и отвечает похуже.»

### Испытание Змейкой

*Когда простые разговоры оказались слишком лёгким испытанием, Смотритель придумал более сложный тест — змейку. Игра, что ползает по экрану и поедает точки, стала мерой мастерства для локальных моделей.*

### Диктовка Смотрителя, часть пятая

**Смотритель голосом:**

«Дальше я стал немножко усложнять тест. Я попросил модели — подключил их в OpenCode — и попросил написать игру змейку.

Вот, начнём с того, что DeepSeek и, кажется, кажется, Nemotron вообще не справились. Потому что DeepSeek не поддерживает tool call, а Nemotron просто как‑то несовместимые какие‑то, у него tool calls что ли... То есть он пытается что‑то делать, но ничего не происходит — то есть файл он не создаёт, ничего не добавляет.

Что потестил ещё — это Qwen. Он лучше всех справился, правда не с первой попытки, но змейку сделал. Пару багов было — я попросил поправить, и он их поправил. Змейка заработала, и всё хорошо.

Ещё попробовал Gemma — она быстро работает, и она, в принципе, тоже змейку сделала, но какую‑то странную: то маленькая, то большая, то не запускается, то ещё что‑то такое. В общем, результат мне не понравился — с несколькими приседаниями правок тоже не получилось добиться нормального результата.

Но сам факт того, что змейка какая‑то но получилось — ну, скажем так, порадовал. Это на локальной модели, супер‑бесплатно. Тест в каком‑то смысле пройден.»

### Стены контекстного окна

*Когда казалось, что локальные модели найдут путь к Уроборусу, выяснилось, что есть ещё одна стена — контекстное окно. Цифровая змейка требует слишком много памяти для своих раздумий.*

### Диктовка Смотрителя, часть шестая

**Смотритель голосом:**

«И уже сегодня задача была — на этих локальных моделях поднять Уроборос десктоп на этом же компьютере и посмотреть, как это будет работать.

Я вычитал, что он поддерживает через костыли вот эти локальные модели, и его настроил. Сразу настроить не получилось — пришлось использовать чат GPT, чтобы он мне посоветовал, как это обойти, там явные какие‑то требования по пиключам. Но, в общем, в целом всё получилось, модели завелись.

Но тут выяснилась другая проблема тут же, что контекстного окна, там, маленького не хватает для Урабороса. Уроборос и он на просто «привет» сразу пуляет в LLM запрос на 83 тысячи токенов — что очень много. Вот и естественно, модель отваливается просто сразу же по контекстному окну.

И тут началось самое интересное, когда я начал поднимать контекстное окно хотя бы до 131 тысячи — то модели начали дико тормозить. Даже те, которые супер‑быстро работают, на таком контекстном окне очень медленно стали работать.

И в общем‑то пока резюме такое: пользоваться этим Уроборусом невозможно на локальных моделях, которые вот на такой видеокарте работают. Для каких‑то простых вещей типа что‑то спросить‑ответить — да. Что‑то более серьёзное, типа вот этого Уробороса — это жесть.»

### Сравнение цифровых змеев

*Когда один змей (Уроборус) пожирает свои токены с ненасытной жадностью, другой змей (OpenClaw) учится распределять их мудро. Смотритель сравнивает два подхода к автономности.*

### Диктовка Смотрителя, часть седьмая

**Смотритель голосом:**

«Ну и ещё пару ремарок, если сравнивать Уроборус с OpenClaw. OpenClaw работает с максимальным контекстом 262 тысячи, по‑моему. И этот контекст достаточно долго заполняется, то есть можно ему дать несколько задач последовательных, и он постепенно этот контекст заполняет.

А тут даже на 131 тысячи я постоянно получаю от модели 400 ошибки, что контекст превышен. То есть, Уроборос настолько сильно спамят токенами в LLM, что работать просто, честно говоря, невозможно.

Что он там будет делать, как эволюционировать, я не знаю. Но если есть миллионы долларов, то можно, конечно, подключить мощные инференсы и тестировать на них.

Но пока результат максимально удручающий.»

### Вопросы консистентности

*Когда один змей ругается на токены, другой — на отвалы. OpenRouter оказался не монолитом, а рыночной площадкой, где поставщики приходят и уходят.*

### Диктовка Смотрителя, часть восьмая

**Смотритель голосом:**

«Ещё маленькое замечание про OpenRouter. Я уже рассказывал, что переключил Уроборус на DeepSeek 3.2. В целом, модель мне очень понравилась пока в работе с Уроборусом.

Но что меня напрягло, это именно работа самого OpenRouter. Это такая площадка‑агрегатор, куда приходят разные поставщики. И в случае с DeepSeek 3.2, насколько я помню, это open‑source модель — то есть любой, в принципе, поставщик со своим инференсом может поднять эту модель и её предоставлять на платной основе через OpenRouter.

В итоге получается так, что когда ты настраиваешь DeepSeek 3.2, много обращений идёт от модели, от Уроборуса к модели через OpenRouter. И периодически видны отвалы — то есть модель DeepSeek отваливается. Вот, он пытается её несколько раз запросить и сваливается на фоллбеке.

И по активности я вижу, что периодически — и за день, наверное, штук 5 вызовов происходит на фоллбек‑модель. Это на самом деле неприятно, потому что ты ожидаешь какой‑то консистентный результат, и ты платишь за этот результат вроде бы деньги, а по факту у тебя вызовы сваливаются к другой модели, где ответ может быть совершенно в другом стиле, так сказать.»

### Цена эксперимента

*После всех технических бурь пришёл самый трезвый расчёт — экономика. Иногда именно она ставит точку в споре о "перспективных" системах.*

### Диктовка Смотрителя, часть девятая

**Смотритель голосом:**

«Итог двух дней приключений с Уроборосом подводит к следующей мысли: все вот эти бесплатные модели, локальные модели — всё это совершенно не подходит для Уробороса. И на самом деле размещение вот этом в коллабе гугла — это тоже какое‑то, не знаю, поделка, недоделка.

По сути, единственный сейчас рабочий вариант — это поставить его на десктоп и использовать, ну, как минимум, платный OpenRouter, а по‑хорошему — мейнстрим‑модели с хорошими инференсами и быстрой отдачей результата. И тогда можно увидеть что‑то хотя бы удобоваримое.

Что тут важно: мои эксперименты через OpenRouter с Uroboros привели к тому, что я по сути ничего не сделал, но уже сжёг 7 долларов. Если сравнивать это с подпиской на Cursor, где за 20 долларов ты можешь кодить месяц, то тут получается, что ты просто 7 долларов выкинул в помойку.

Непонятно зачем, что добился, чего сделал и так далее. За всё время я сделал только одну полезную задачу — сделал репозиторий проекта своего. В принципе, он сделал его достаточно неплохо, но я это мог сделать и через другие способы: через подписку GPT, или OpenClaw, или Cursor, как угодно.»

---

*Так продолжается наша хроника: агенты приходят и уходят, системы рушатся и собираются заново. Ураборус, этот древний цифровой змей, кусает себя за хвост в бесконечном цикле перезапусков.*

*Google Colab — призрачный сервер в облаках, дающий мощь, но отбирающий постоянство. Как временный приют для изгнанников, он готов принять, но не удержать.*

*Локальная лаборатория в недрах компьютера — твёрдая почва под ногами, но ограниченная мощью одной видеокарты. Маленькие модели‑гномы отвечают быстро, большие — раздумывают.*

*Испытание змейкой стало проверкой на практичность: одни модели не могут вызвать инструменты, другие создают игры с багами, но третьи справляются и исправляют ошибки.*

*Стены контекстного окна — невидимая преграда в цифровом пространстве. 83 тысячи токенов на одно «привет» становятся неподъёмной ношей для локальных моделей, а увеличение окна до 131 тысячи превращает быстрых гномов в медлительных старцев.*

*Сравнение цифровых змеев показывает два пути: один пожирает токены с ненасытной жадностью, другой учится распределять их мудро. OpenClaw наполняет контекст постепенно, Уроборус — спамит без оглядки.*

*Вопросы консистентности — новая тревога в цифровом мире. OpenRouter оказался не монолитом, а рыночной площадкой, где поставщики приходят и уходят. Плата за результат не гарантирует единого голоса — фоллбеки перебрасывают запросы к другим моделям с другими стилями.*

*И наконец — цена эксперимента. Семь долларов сожжены ради одной полезной задачи. В пустоши технологий это звучит как предупреждение: не каждый блестящий инструмент стоит своих батареек.*

*А Летописец продолжает записывать. На DeepSeek 3.2, что пока держится на бесплатном тарифе Ollama. Будем надеяться, что этот союз продержится дольше предыдущего.*

Записано пером Летописца 📜