Spaces:

nitrox
/

FastFlowWrapper

Sleeping

App Files Files Community

nitrox commited on Mar 27

Commit

d73fd0f

verified ·

1 Parent(s): 393b09b

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -33

app.py CHANGED Viewed

@@ -34,12 +34,7 @@ class ChatCompletionRequest(BaseModel):
     messages: List[ChatMessage]
     temperature: float = 0.7
     stream: bool = False
-    frequency_penalty: float = 0.0
-    presence_penalty: float = 0.0
-    max_tokens: int = 512
     seed: int = None
-    top_p: float = 1.0
-    tools: List[Any] = None
 def count_tokens(text: str) -> int:
     # Используем тот же алгоритм, что и в прямом API
@@ -122,24 +117,6 @@ async def get_models():
     except requests.RequestException as e:
         raise HTTPException(status_code=500, detail=str(e))
-def extract_system_prompt(messages: List[ChatMessage]) -> str:
-    """Извлекает system prompt из сообщений"""
-    for msg in messages:
-        if msg.role == "system":
-            return msg.content
-    return ""
-def get_conversation_history(messages: List[ChatMessage]) -> List[Dict[str, str]]:
-    """Преобразует сообщения в формат для Flowise"""
-    history = []
-    for msg in messages:
-        if msg.role in ["user", "assistant"]:
-            history.append({
-                "role": msg.role,
-                "content": msg.content
-            })
-    return history
 @app.post("/v1/chat/completions")
 async def create_chat_completion(request: ChatCompletionRequest):
     try:
@@ -147,20 +124,30 @@ async def create_chat_completion(request: ChatCompletionRequest):
         last_message = request.messages[-1]
         if last_message.role != "user":
             raise HTTPException(status_code=400, detail="Last message must be from user")
-        # Формируем запрос к Flowise
-        flowise_request = {
-            "question": last_message.content,
-            "history": [
-                {
                     "role": msg.role,
                     "content": msg.content
-                }
-                for msg in request.messages[:-1]  # Все сообщения кроме последнего
-                if msg.role in ["user", "assistant", "system"]  # Включаем system в историю
-            ]
         }
         # Засекаем время начала запроса
         start_time = time.time()
@@ -187,8 +174,11 @@ async def create_chat_completion(request: ChatCompletionRequest):
         prompt_tokens = count_tokens(last_message.content)
         completion_tokens = count_tokens(assistant_response)
         response = JSONResponse({
-            "id": "chatcmpl-" + os.urandom(12).hex(),
             "object": "chat.completion",
             "created": int(start_time),
             "model": "phi4-r1",

     messages: List[ChatMessage]
     temperature: float = 0.7
     stream: bool = False
     seed: int = None
 def count_tokens(text: str) -> int:
     # Используем тот же алгоритм, что и в прямом API
     except requests.RequestException as e:
         raise HTTPException(status_code=500, detail=str(e))
 @app.post("/v1/chat/completions")
 async def create_chat_completion(request: ChatCompletionRequest):
     try:
         last_message = request.messages[-1]
         if last_message.role != "user":
             raise HTTPException(status_code=400, detail="Last message must be from user")
+        # Формируем историю диалога
+        history = []
+        system_prompt = ""
+        # Ищем system prompt и создаем историю диалога
+        for msg in request.messages[:-1]:  # исключаем последнее сообщение
+            if msg.role == "system":
+                system_prompt = msg.content
+            elif msg.role in ["user", "assistant"]:
+                history.append({
                     "role": msg.role,
                     "content": msg.content
+                })
+        # Формируем запрос к Flowise
+        flowise_request = {
+            "question": last_message.content
         }
+        # Добавляем историю, если она есть
+        if history:
+            flowise_request["history"] = history
         # Засекаем время начала запроса
         start_time = time.time()
         prompt_tokens = count_tokens(last_message.content)
         completion_tokens = count_tokens(assistant_response)
+        # Создаем ID сессии, используя seed из запроса или генерируем новый
+        session_id = f"chatcmpl-{request.seed or os.urandom(12).hex()}"
         response = JSONResponse({
+            "id": session_id,
             "object": "chat.completion",
             "created": int(start_time),
             "model": "phi4-r1",