Skip to content

MaximBayer/UI-TARS-UA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1,110 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Agent TARS Banner

Вступ

TARS* - це стек мультимодального AI Agent, який наразі включає два проекти: Agent TARS та UI-TARS-desktop:

Agent TARS UI-TARS-desktop
agent-tars-book-hotel.mp4
computer-use-triple-speed.mp4
Agent TARS - це універсальний стек мультимодального AI Agent, який приносить потужність GUI Agent та Vision у ваш термінал, комп'ютер, браузер та продукт.

Він в першу чергу постачається з CLI та Web UI для використання. Він має на меті забезпечити робочий процес, який є ближчим до людського виконання завдань через передові мультимодальні LLM та безшовну інтеграцію з різними інструментами MCP.
UI-TARS Desktop - це десктопний додаток, який надає нативний GUI Agent на основі моделі UI-TARS.

Він в першу чергу постачається з локальним та віддаленим операторами комп'ютера, а також операторами браузера.

Зміст

Новини

  • [2025-11-05] 🎉 Ми раді оголосити про випуск Agent TARS CLI v0.3.0! Ця версія приносить підтримку потокової передачі для кількох інструментів, налаштування часу виконання зі статистикою для викликів інструментів, Event Stream Viewer та ексклюзивну підтримку AIO agent Sandbox.
  • [2025-06-25] Ми випустили Agent TARS Beta та Agent TARS CLI - Представляємо Agent TARS Beta, мультимодальний AI агент, який має на меті дослідити форму роботи, ближчу до людського виконання завдань.
  • [2025-06-12] - 🎁 Ми раді оголосити про випуск UI-TARS Desktop v0.2.0! Це оновлення представляє дві потужні нові функції: Віддалений оператор комп'ютера та Віддалений оператор браузера — обидві повністю безкоштовні.
  • [2025-04-17] - 🎉 Ми раді оголосити про випуск нового додатку UI-TARS Desktop v0.1.0 з переробленим Agent UI. Додаток покращує досвід використання комп'ютера, вводить нові функції роботи з браузером та підтримує розширену модель UI-TARS-1.5.
  • [2025-02-20] - 📦 Представлений UI TARS SDK - потужний крос-платформний інструментарій для побудови агентів автоматизації GUI.
  • [2025-01-23] - 🚀 Ми оновили розділ Хмарне розгортання з новою інформацією про платформу ModelScope.

Українська локалізація

🇺🇦 UI-TARS Desktop тепер повністю підтримує українську мову!

Що було змінено:

✅ Інтерфейс користувача

  • Повністю перекладені всі компоненти UI:
    • Головна сторінка та панель навігації
    • Всі діалогові вікна та модальні форми
    • Налаштування (Settings) та всі його категорії
    • Бічна панель (History, Share, Navigation)
    • Повідомлення та toast-нотифікації
    • Кнопки, підказки та placeholder-и

✅ VLM (Vision-Language Model)

  • Мова виводу VLM змінена на українську:
    • Модель тепер відповідає українською мовою
    • Системні промпти оновлені для української мови
    • Підтримка тільки української мови (uk) замість англійської/китайської
    • Приклади в промптах адаптовані для української мови

✅ Налаштування та конфігурація

  • Мова за замовчуванням: Українська
  • Доступні мови: Тільки українська (китайська та англійська видалені з вибору)
  • Валідація: Всі схеми Zod оновлені для підтримки української мови

📁 Змінені файли:

Основні компоненти:
├── apps/ui-tars/src/main/
│   ├── store/setting.ts          # Мова за замовчуванням: 'uk'
│   ├── store/validate.ts         # Enum мов: ['uk']
│   ├── utils/agent.ts            # Тип мови VLM: 'uk'
│   └── agent/prompts.ts          # Українські промпти VLM

Компоненти UI:
├── apps/ui-tars/src/renderer/src/
│   ├── pages/
│   │   ├── home/index.tsx        # Головна сторінка
│   │   └── settings/             # Налаштування
│   ├── components/
│   │   ├── Settings/             # Діалоги налаштувань
│   │   │   ├── global.tsx
│   │   │   ├── local.tsx
│   │   │   ├── remote.tsx
│   │   │   └── category/         # Категорії налаштувань
│   │   ├── SideBar/              # Бічна панель
│   │   ├── AlertDialog/          # Діалогові вікна
│   │   ├── ChatInput/            # Введення повідомлень
│   │   └── RunMessages/          # Повідомлення виконання

Використання:

Просто запустіть додаток - українська мова вже встановлена за замовчуванням! 🎉

cd E:\UI-TARS-desktop
pnpm install
pnpm dev:ui-tars

Agent TARS

npm version downloads node version Discord Community Official Twitter

Agent TARS - це універсальний стек мультимодального AI Agent, який приносить потужність GUI Agent та Vision у ваш термінал, комп'ютер, браузер та продукт.

Він в першу чергу постачається з CLI та Web UI для використання. Він має на меті забезпечити робочий процес, який є ближчим до людського виконання завдань через передові мультимодальні LLM та безшовну інтеграцію з різними інструментами MCP.

Демонстрація

Будь ласка, допоможіть мені забронювати найраніший рейс із Сан-Хосе до Нью-Йорка 1 вересня та останній зворотний рейс 6 вересня на Priceline
agent-tars-new-flight.mp4

Основні функції

  • 🖱️ CLI в один клік - Підтримує як headful Web UI, так і headless сервер виконання.
  • 🌐 Гібридний браузерний агент - Керування браузерами за допомогою GUI Agent, DOM або гібридної стратегії.
  • 🔄 Event Stream - Event Stream, керований протоколом, забезпечує Context Engineering та Agent UI.
  • 🧰 Інтеграція MCP - Ядро побудоване на MCP та також підтримує монтування MCP Servers для підключення до реальних інструментів.

Швидкий старт

Agent TARS CLI

# Запуск за допомогою `npx`.
npx @agent-tars/cli@latest

# Глобальне встановлення, потрібен Node.js >= 22
npm install @agent-tars/cli@latest -g

# Запуск з вашим провайдером моделі
agent-tars --provider volcengine --model doubao-1-5-thinking-vision-pro-250428 --apiKey ваш-api-ключ
agent-tars --provider anthropic --model claude-3-7-sonnet-latest --apiKey ваш-api-ключ

Відвідайте повний посібник Швидкий старт для детальних інструкцій з налаштування.

Документація

🌟 Досліджуйте всесвіт Agent TARS 🌟

Категорія Посилання на ресурс Опис
🏠 Центральний хаб Website Ваш шлюз до екосистеми Agent TARS
📚 Швидкий старт Quick Start Від нуля до героя за 5 хвилин
🚀 Що нового Blog Відкрийте передові функції та бачення
🛠️ Зона розробника Docs Освойте кожну команду та функцію
🎯 Демонстрація Examples Перегляньте приклади використання від офіційної команди та спільноти
🔧 Довідка API Повна технічна довідка



UI-TARS Desktop

UI-TARS

UI-TARS Desktop - це нативний GUI агент для вашого локального комп'ютера, керований моделями UI-TARS та серії Seed-1.5-VL/1.6.

   📑 Стаття    | 🤗 Моделі Hugging Face   |   🫨 Discord   |   🤖 ModelScope  
🖥️ Десктопний додаток    |    👓 Midscene (використання в браузері)   

Демонстрація

Інструкція Локальний оператор Віддалений оператор
Будь ласка, допоможіть мені увімкнути функцію автозбереження VS Code та встановити затримку операцій AutoSave на 500 мілісекунд.
computer-use-triple-speed.mp4
remote-computer-operators.mp4
Чи могли б ви допомогти мені перевірити останню відкриту проблему проекту UI-TARS-Desktop на GitHub?
browser-use-triple-speed.mp4
remote-browser-operators.mp4

Функції

  • 🤖 Керування природною мовою на базі Vision-Language Model
  • 🖥️ Підтримка скріншотів та візуального розпізнавання
  • 🎯 Точне керування мишею та клавіатурою
  • 💻 Крос-платформна підтримка (Windows/MacOS/Browser)
  • 🔄 Зворотній зв'язок у реальному часі та відображення статусу
  • 🔐 Приватний та безпечний - повністю локальна обробка
  • 🇺🇦 Повна підтримка української мови

Швидкий старт

Дивіться Швидкий старт

Участь у розробці

Дивіться CONTRIBUTING.md.

Ліцензія

Цей проект ліцензовано під Apache License 2.0.

Цитування

Якщо ви вважаєте нашу статтю та код корисними у вашому дослідженні, будь ласка, розгляньте можливість поставити зірку ⭐ та цитування 📝

@article{qin2025ui,
  title={UI-TARS: Pioneering Automated GUI Interaction with Native Agents},
  author={Qin, Yujia and Ye, Yining and Fang, Junjie and Wang, Haoming and Liang, Shihao and Tian, Shizuo and Zhang, Junda and Li, Jiahao and Li, Yunxin and Huang, Shijue and others},
  journal={arXiv preprint arXiv:2501.12326},
  year={2025}
}

About

🇺🇦 UI-TARS Desktop з повною українською локалізацією | Multimodal AI Agent з GUI контролем

Topics

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Packages

 
 
 

Contributors