File size: 5,606 Bytes
5ecb399
 
 
 
58cec34
5ecb399
 
588adc0
 
5ecb399
 
 
58cec34
 
 
 
 
 
 
 
 
 
 
dbc3350
5ecb399
588adc0
5ecb399
588adc0
5ecb399
588adc0
5ecb399
588adc0
5ecb399
588adc0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
dbc3350
 
 
 
 
 
 
 
 
 
588adc0
 
 
 
 
dbc3350
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
---
title: TEN Agent
emoji: 🤖
colorFrom: blue
colorTo: purple
sdk: docker
sdk_version: "latest"
app_port: 7860
app_file: app.py
pinned: false
---

![TEN Agent banner](https://github.com/TEN-framework/docs/blob/main/assets/jpg/banner.jpg?raw=true)

<div align="center">

[![Follow on X](https://img.shields.io/twitter/follow/TenFramework?logo=X&color=%20%23f5f5f5)](https://twitter.com/intent/follow?screen_name=TenFramework)
[![Discussion posts](https://img.shields.io/github/discussions/TEN-framework/ten-agent?labelColor=%20%23FDB062&color=%20%23f79009)](https://github.com/TEN-framework/ten-agent/discussions/)
[![Commits](https://img.shields.io/github/commit-activity/m/TEN-framework/ten-agent?labelColor=%20%237d89b0&color=%20%235d6b98)](https://github.com/TEN-framework/ten-agent/graphs/commit-activity)
[![Issues closed](https://img.shields.io/github/issues-search?query=repo%3ATEN-framework%2Ften-agent%20is%3Aclosed&label=issues%20closed&labelColor=green&color=green)](https://github.com/TEN-framework/ten-agent/issues)
[![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](https://github.com/TEN-framework/ten-agent/pulls)
[![GitHub license](https://img.shields.io/badge/License-Apache_2.0-blue.svg?labelColor=%20%23155EEF&color=%20%23528bff)](https://github.com/TEN-framework/ten-agent/blob/main/LICENSE)

# TEN-Agent на Hugging Face Space

Это адаптированная версия [TEN-Agent](https://github.com/TEN-framework/TEN-Agent) для работы на платформе Hugging Face Spaces.

## Описание

TEN-Agent - это разговорный голосовой AI-агент, работающий на базе фреймворка TEN. Он интегрирует различные LLM модели, включая Deepseek, Gemini, OpenAI, технологии RTC и другие инструменты.

## Особенности

- 🗣️ **Голосовое общение**: Интеграция с ASR (распознавание речи) и TTS (синтез речи)
- 👀 **Зрение**: Обработка и анализ изображений с камеры
- 🧠 **Различные LLM**: Поддержка OpenAI, Gemini, DeepSeek и других
- 🔗 **Расширения**: Модульная архитектура с возможностью добавления новых функций

## Метод запуска (ВАЖНО!)

Для решения проблем с запуском в Hugging Face Space, мы используем:

1. **Python API Wrapper** вместо оригинального Go-сервера
2. **Хранение всех файлов** в директории `/tmp/ten_user`
3. **Запуск через app.py**, а не через оригинальные скрипты

> **Эта версия специально адаптирована для Hugging Face Space и решает проблемы с правами доступа!**

## Настройка

В интерфейсе необходимо настроить следующие API ключи:

1. **OpenAI API Key**: Для текстовой обработки
2. **Deepgram API Key**: Для распознавания речи 
3. **ElevenLabs API Key**: Для генерации голоса
4. **Agora App ID и App Certificate**: Для работы с RTC

## Графы

В системе предустановлены два графа:

1. **Voice Agent**: Голосовой агент с OpenAI и ElevenLabs
2. **Chat Agent**: Текстовый чат с OpenAI

## Как использовать

1. Дождитесь полной загрузки интерфейса
2. Нажмите на кнопку "Открыть TEN Agent UI"
3. В новой вкладке настройте API ключи
4. Выберите нужный график и начните общение с агентом

## Ограничения

В текущей версии на Hugging Face Space имеются следующие ограничения:

- Ограниченная производительность веб-интерфейса
- Отсутствие постоянного хранилища для загружаемых файлов
- Некоторые функции могут работать медленнее, чем в локальной установке

## Запуск локально

Для локального запуска полной версии следуйте инструкциям в [официальном репозитории](https://github.com/TEN-framework/TEN-Agent).

## Доступные функции

- **Голосовой агент**: Взаимодействие с ИИ через голос
- **Чат-агент**: Текстовое взаимодействие с ИИ
- **Интеграция с различными LLM**: OpenAI, Gemini, Deepseek и другие
- **Мультимодальные возможности**: Анализ изображений, интерпретация голоса и другие функции

## Технические детали

Этот Space использует свой собственный метод запуска через Python-обертку:

```python
python3 app.py
```

## Ссылки

- [Официальный репозиторий TEN-Agent](https://github.com/TEN-framework/TEN-Agent)
- [Документация TEN-Agent](https://doc.theten.ai/ten-agent/getting_started)
- [Сайт TEN Framework](https://agent.theten.ai/)