File size: 5,606 Bytes
5ecb399 58cec34 5ecb399 588adc0 5ecb399 58cec34 dbc3350 5ecb399 588adc0 5ecb399 588adc0 5ecb399 588adc0 5ecb399 588adc0 5ecb399 588adc0 dbc3350 588adc0 dbc3350 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 |
---
title: TEN Agent
emoji: 🤖
colorFrom: blue
colorTo: purple
sdk: docker
sdk_version: "latest"
app_port: 7860
app_file: app.py
pinned: false
---

<div align="center">
[](https://twitter.com/intent/follow?screen_name=TenFramework)
[](https://github.com/TEN-framework/ten-agent/discussions/)
[](https://github.com/TEN-framework/ten-agent/graphs/commit-activity)
[](https://github.com/TEN-framework/ten-agent/issues)
[](https://github.com/TEN-framework/ten-agent/pulls)
[](https://github.com/TEN-framework/ten-agent/blob/main/LICENSE)
# TEN-Agent на Hugging Face Space
Это адаптированная версия [TEN-Agent](https://github.com/TEN-framework/TEN-Agent) для работы на платформе Hugging Face Spaces.
## Описание
TEN-Agent - это разговорный голосовой AI-агент, работающий на базе фреймворка TEN. Он интегрирует различные LLM модели, включая Deepseek, Gemini, OpenAI, технологии RTC и другие инструменты.
## Особенности
- 🗣️ **Голосовое общение**: Интеграция с ASR (распознавание речи) и TTS (синтез речи)
- 👀 **Зрение**: Обработка и анализ изображений с камеры
- 🧠 **Различные LLM**: Поддержка OpenAI, Gemini, DeepSeek и других
- 🔗 **Расширения**: Модульная архитектура с возможностью добавления новых функций
## Метод запуска (ВАЖНО!)
Для решения проблем с запуском в Hugging Face Space, мы используем:
1. **Python API Wrapper** вместо оригинального Go-сервера
2. **Хранение всех файлов** в директории `/tmp/ten_user`
3. **Запуск через app.py**, а не через оригинальные скрипты
> **Эта версия специально адаптирована для Hugging Face Space и решает проблемы с правами доступа!**
## Настройка
В интерфейсе необходимо настроить следующие API ключи:
1. **OpenAI API Key**: Для текстовой обработки
2. **Deepgram API Key**: Для распознавания речи
3. **ElevenLabs API Key**: Для генерации голоса
4. **Agora App ID и App Certificate**: Для работы с RTC
## Графы
В системе предустановлены два графа:
1. **Voice Agent**: Голосовой агент с OpenAI и ElevenLabs
2. **Chat Agent**: Текстовый чат с OpenAI
## Как использовать
1. Дождитесь полной загрузки интерфейса
2. Нажмите на кнопку "Открыть TEN Agent UI"
3. В новой вкладке настройте API ключи
4. Выберите нужный график и начните общение с агентом
## Ограничения
В текущей версии на Hugging Face Space имеются следующие ограничения:
- Ограниченная производительность веб-интерфейса
- Отсутствие постоянного хранилища для загружаемых файлов
- Некоторые функции могут работать медленнее, чем в локальной установке
## Запуск локально
Для локального запуска полной версии следуйте инструкциям в [официальном репозитории](https://github.com/TEN-framework/TEN-Agent).
## Доступные функции
- **Голосовой агент**: Взаимодействие с ИИ через голос
- **Чат-агент**: Текстовое взаимодействие с ИИ
- **Интеграция с различными LLM**: OpenAI, Gemini, Deepseek и другие
- **Мультимодальные возможности**: Анализ изображений, интерпретация голоса и другие функции
## Технические детали
Этот Space использует свой собственный метод запуска через Python-обертку:
```python
python3 app.py
```
## Ссылки
- [Официальный репозиторий TEN-Agent](https://github.com/TEN-framework/TEN-Agent)
- [Документация TEN-Agent](https://doc.theten.ai/ten-agent/getting_started)
- [Сайт TEN Framework](https://agent.theten.ai/)
|