AIGENSA Labs
Тут ми проводимо експерименти з реальними агентами та LLM у виробничому середовищі. Вимірюємо що ламається, що масштабується і що виживає. Два інструменти пройшли перевірку.
Інструменти, народжені в лабораторії
Eval Arena
Лише за запрошеннямСтворено на основі понад 100 виробничих розгортань у страхуванні, охороні здоров'я та GovTech. Eval Arena надає бізнес-специфічні рекомендації з оцінки — зосереджені на 20% тестів, які запобігають 80% виробничих збоїв.
Дізнатися більшеjl — CLI для Jupyter
Відкритий кодСтворено після втрати тисяч токенів через накладні витрати схеми MCP у сесіях Claude Code. jl замінює jupyter-mcp-server одним bash-командом — прямий REST API, збережений стан ядра, підтримка SSH.
Переглянути на GitHubЩо ми вивчаємо
Стежте за дослідженнями
Ми пишемо про те, що дізнаємося — архітектурні рішення, патерни збоїв і компроміси, яких немає в бенчмарках.
Читати блог