FastFlowWrapper / app.py
nitrox's picture
Update app.py
ce08ada verified
raw
history blame
4.84 kB
from fastapi import FastAPI, HTTPException
from fastapi.middleware.cors import CORSMiddleware
from fastapi.responses import StreamingResponse, JSONResponse
import os
from dotenv import load_dotenv
import requests
from typing import Dict, Any, List
from pydantic import BaseModel
import time
load_dotenv()
app = FastAPI()
app.add_middleware(
CORSMiddleware,
allow_origins=["*"],
allow_methods=["*"],
allow_headers=["*"]
)
# Получаем переменные окружения
FLOWISE_API_BASE_URL = os.getenv("FLOWISE_API_BASE_URL")
FLOWISE_CHATFLOW_ID = os.getenv("FLOWISE_CHATFLOW_ID")
class ChatMessage(BaseModel):
role: str
content: str
class ChatCompletionRequest(BaseModel):
model: str
messages: List[ChatMessage]
temperature: float = 0.7
def count_tokens(text: str) -> int:
# Простой подсчет токенов (слова + знаки препинания)
return len(text.split()) + len([c for c in text if c in ".,!?;:()[]{}"])
def clean_assistant_response(text: str) -> str:
# Удаляем лишние маркеры кода и форматирования
text = text.strip()
if text.endswith("```"):
text = text[:-3].strip()
return text
@app.get("/")
async def root():
return {"status": "FastFlowWrapper is running"}
@app.get("/v1/models")
async def get_models():
try:
# Запрашиваем список чатфлоу из Flowise
response = requests.get(f"{FLOWISE_API_BASE_URL}/chatflows")
response.raise_for_status()
chatflows = response.json()
# Преобразуем в формат OpenAI API
models = []
for chatflow in chatflows:
models.append({
"id": chatflow.get("id"),
"object": "model",
"created": int(time.time()), # Текущий timestamp
"owned_by": "flowise",
"permission": [],
"root": "flowise",
"parent": None,
"system_fingerprint": "phi4-r1" # Добавляем system_fingerprint
})
return {"object": "list", "data": models}
except requests.RequestException as e:
raise HTTPException(status_code=500, detail=str(e))
@app.post("/v1/chat/completions")
async def create_chat_completion(request: ChatCompletionRequest):
try:
# Получаем последнее сообщение из диалога
last_message = request.messages[-1]
if last_message.role != "user":
raise HTTPException(status_code=400, detail="Last message must be from user")
# Подсчитываем токены запроса
prompt_tokens = count_tokens(last_message.content)
# Формируем запрос к Flowise
flowise_request = {
"question": last_message.content
}
# Засекаем время начала запроса
start_time = time.time()
# Отправляем запрос к Flowise
response = requests.post(
f"{FLOWISE_API_BASE_URL}/prediction/{FLOWISE_CHATFLOW_ID}",
json=flowise_request
)
response.raise_for_status()
# Получаем и очищаем ответ
flowise_response = response.json()
assistant_response = clean_assistant_response(flowise_response.get("text", ""))
# Подсчитываем токены ответа
completion_tokens = count_tokens(assistant_response)
return {
"id": "chatcmpl-" + os.urandom(12).hex(),
"object": "chat.completion",
"created": int(start_time), # Используем время начала запроса
"model": "phi4-r1", # Используем тот же model_id что и в прямом API
"choices": [
{
"index": 0,
"logprobs": None, # Добавляем поле logprobs
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": assistant_response
}
}
],
"usage": {
"prompt_tokens": prompt_tokens,
"completion_tokens": completion_tokens,
"total_tokens": prompt_tokens + completion_tokens
},
"stats": {}, # Добавляем пустой объект stats
"system_fingerprint": "phi4-r1" # Добавляем system_fingerprint
}
except requests.RequestException as e:
raise HTTPException(status_code=500, detail=str(e))