Spaces:

mynuddin
/

chatbot-space

Sleeping

mynuddin commited on Mar 13

Commit

418e6bc

verified ·

1 Parent(s): 3580467

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,19 @@
 from fastapi import FastAPI
 from transformers import AutoModelForCausalLM, AutoTokenizer
-import torch
 model_name = "mynuddin/chatbot"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name).to("cpu")
 app = FastAPI()
 @app.post("/generate")
 def generate_text(prompt: str):
     inputs = tokenizer(prompt, return_tensors="pt")
-    with torch.no_grad():
-        output = model.generate(**inputs, max_length=128)
     generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
     return {"generated_query": generated_text}

+import os
 from fastapi import FastAPI
 from transformers import AutoModelForCausalLM, AutoTokenizer
+os.environ["HF_HOME"] = "/app/cache"
+# Load model
 model_name = "mynuddin/chatbot"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name).to("cpu")
 app = FastAPI()
 @app.post("/generate")
 def generate_text(prompt: str):
     inputs = tokenizer(prompt, return_tensors="pt")
+    output = model.generate(**inputs, max_length=128)
     generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
     return {"generated_query": generated_text}