TARS* - це стек мультимодального AI Agent, який наразі включає два проекти: Agent TARS та UI-TARS-desktop:
| Agent TARS | UI-TARS-desktop |
|---|---|
agent-tars-book-hotel.mp4 |
computer-use-triple-speed.mp4 |
|
Agent TARS - це універсальний стек мультимодального AI Agent, який приносить потужність GUI Agent та Vision у ваш термінал, комп'ютер, браузер та продукт.
Він в першу чергу постачається з CLI та Web UI для використання. Він має на меті забезпечити робочий процес, який є ближчим до людського виконання завдань через передові мультимодальні LLM та безшовну інтеграцію з різними інструментами MCP. |
UI-TARS Desktop - це десктопний додаток, який надає нативний GUI Agent на основі моделі UI-TARS.
Він в першу чергу постачається з локальним та віддаленим операторами комп'ютера, а також операторами браузера. |
- [2025-11-05] 🎉 Ми раді оголосити про випуск Agent TARS CLI v0.3.0! Ця версія приносить підтримку потокової передачі для кількох інструментів, налаштування часу виконання зі статистикою для викликів інструментів, Event Stream Viewer та ексклюзивну підтримку AIO agent Sandbox.
- [2025-06-25] Ми випустили Agent TARS Beta та Agent TARS CLI - Представляємо Agent TARS Beta, мультимодальний AI агент, який має на меті дослідити форму роботи, ближчу до людського виконання завдань.
- [2025-06-12] - 🎁 Ми раді оголосити про випуск UI-TARS Desktop v0.2.0! Це оновлення представляє дві потужні нові функції: Віддалений оператор комп'ютера та Віддалений оператор браузера — обидві повністю безкоштовні.
- [2025-04-17] - 🎉 Ми раді оголосити про випуск нового додатку UI-TARS Desktop v0.1.0 з переробленим Agent UI. Додаток покращує досвід використання комп'ютера, вводить нові функції роботи з браузером та підтримує розширену модель UI-TARS-1.5.
- [2025-02-20] - 📦 Представлений UI TARS SDK - потужний крос-платформний інструментарій для побудови агентів автоматизації GUI.
- [2025-01-23] - 🚀 Ми оновили розділ Хмарне розгортання з новою інформацією про платформу ModelScope.
🇺🇦 UI-TARS Desktop тепер повністю підтримує українську мову!
- Повністю перекладені всі компоненти UI:
- Головна сторінка та панель навігації
- Всі діалогові вікна та модальні форми
- Налаштування (Settings) та всі його категорії
- Бічна панель (History, Share, Navigation)
- Повідомлення та toast-нотифікації
- Кнопки, підказки та placeholder-и
- Мова виводу VLM змінена на українську:
- Модель тепер відповідає українською мовою
- Системні промпти оновлені для української мови
- Підтримка тільки української мови (
uk) замість англійської/китайської - Приклади в промптах адаптовані для української мови
- Мова за замовчуванням: Українська
- Доступні мови: Тільки українська (китайська та англійська видалені з вибору)
- Валідація: Всі схеми Zod оновлені для підтримки української мови
Основні компоненти:
├── apps/ui-tars/src/main/
│ ├── store/setting.ts # Мова за замовчуванням: 'uk'
│ ├── store/validate.ts # Enum мов: ['uk']
│ ├── utils/agent.ts # Тип мови VLM: 'uk'
│ └── agent/prompts.ts # Українські промпти VLM
Компоненти UI:
├── apps/ui-tars/src/renderer/src/
│ ├── pages/
│ │ ├── home/index.tsx # Головна сторінка
│ │ └── settings/ # Налаштування
│ ├── components/
│ │ ├── Settings/ # Діалоги налаштувань
│ │ │ ├── global.tsx
│ │ │ ├── local.tsx
│ │ │ ├── remote.tsx
│ │ │ └── category/ # Категорії налаштувань
│ │ ├── SideBar/ # Бічна панель
│ │ ├── AlertDialog/ # Діалогові вікна
│ │ ├── ChatInput/ # Введення повідомлень
│ │ └── RunMessages/ # Повідомлення виконання
Просто запустіть додаток - українська мова вже встановлена за замовчуванням! 🎉
cd E:\UI-TARS-desktop
pnpm install
pnpm dev:ui-tarsAgent TARS - це універсальний стек мультимодального AI Agent, який приносить потужність GUI Agent та Vision у ваш термінал, комп'ютер, браузер та продукт.
Він в першу чергу постачається з CLI та Web UI для використання.
Він має на меті забезпечити робочий процес, який є ближчим до людського виконання завдань через передові мультимодальні LLM та безшовну інтеграцію з різними інструментами MCP.
Будь ласка, допоможіть мені забронювати найраніший рейс із Сан-Хосе до Нью-Йорка 1 вересня та останній зворотний рейс 6 вересня на Priceline
agent-tars-new-flight.mp4
- 🖱️ CLI в один клік - Підтримує як headful Web UI, так і headless сервер виконання.
- 🌐 Гібридний браузерний агент - Керування браузерами за допомогою GUI Agent, DOM або гібридної стратегії.
- 🔄 Event Stream - Event Stream, керований протоколом, забезпечує Context Engineering та Agent UI.
- 🧰 Інтеграція MCP - Ядро побудоване на MCP та також підтримує монтування MCP Servers для підключення до реальних інструментів.
# Запуск за допомогою `npx`.
npx @agent-tars/cli@latest
# Глобальне встановлення, потрібен Node.js >= 22
npm install @agent-tars/cli@latest -g
# Запуск з вашим провайдером моделі
agent-tars --provider volcengine --model doubao-1-5-thinking-vision-pro-250428 --apiKey ваш-api-ключ
agent-tars --provider anthropic --model claude-3-7-sonnet-latest --apiKey ваш-api-ключВідвідайте повний посібник Швидкий старт для детальних інструкцій з налаштування.
🌟 Досліджуйте всесвіт Agent TARS 🌟
UI-TARS Desktop - це нативний GUI агент для вашого локального комп'ютера, керований моделями UI-TARS та серії Seed-1.5-VL/1.6.
📑 Стаття
| 🤗 Моделі Hugging Face
| 🫨 Discord
| 🤖 ModelScope
🖥️ Десктопний додаток
| 👓 Midscene (використання в браузері)
| Інструкція | Локальний оператор | Віддалений оператор |
|---|---|---|
| Будь ласка, допоможіть мені увімкнути функцію автозбереження VS Code та встановити затримку операцій AutoSave на 500 мілісекунд. | computer-use-triple-speed.mp4 |
remote-computer-operators.mp4 |
| Чи могли б ви допомогти мені перевірити останню відкриту проблему проекту UI-TARS-Desktop на GitHub? | browser-use-triple-speed.mp4 |
remote-browser-operators.mp4 |
- 🤖 Керування природною мовою на базі Vision-Language Model
- 🖥️ Підтримка скріншотів та візуального розпізнавання
- 🎯 Точне керування мишею та клавіатурою
- 💻 Крос-платформна підтримка (Windows/MacOS/Browser)
- 🔄 Зворотній зв'язок у реальному часі та відображення статусу
- 🔐 Приватний та безпечний - повністю локальна обробка
- 🇺🇦 Повна підтримка української мови
Дивіться Швидкий старт
Дивіться CONTRIBUTING.md.
Цей проект ліцензовано під Apache License 2.0.
Якщо ви вважаєте нашу статтю та код корисними у вашому дослідженні, будь ласка, розгляньте можливість поставити зірку ⭐ та цитування 📝
@article{qin2025ui,
title={UI-TARS: Pioneering Automated GUI Interaction with Native Agents},
author={Qin, Yujia and Ye, Yining and Fang, Junjie and Wang, Haoming and Liang, Shihao and Tian, Shizuo and Zhang, Junda and Li, Jiahao and Li, Yunxin and Huang, Shijue and others},
journal={arXiv preprint arXiv:2501.12326},
year={2025}
}