Spaces:

ksvmuralidhar
/

news_summarizer_api

Sleeping

ksvmuralidhar commited on Aug 18, 2024

Commit

fb33e1e

verified ·

1 Parent(s): 6b0c0e0

Update api.py

Files changed (1) hide show

api.py CHANGED Viewed

@@ -28,7 +28,7 @@ def load_summarizer_models():
     return summ_tokenizer, summ_model
-async def summ_preprocess(txt):
     txt = re.sub(r'^By \. [\w\s]+ \. ', ' ', txt) # By . Ellie Zolfagharifard .
     txt = re.sub(r'\d{1,2}\:\d\d [a-zA-Z]{3}', ' ', txt) # 10:30 EST
     txt = re.sub(r'\d{1,2} [a-zA-Z]+ \d{4}', ' ', txt) # 10 November 1990
@@ -51,7 +51,7 @@ async def summ_inference_tokenize(input_: list, n_tokens: int):
 async def summ_inference(txts: str):
-    txts = [*map(await summ_preprocess, txts)]
     inference_tokenizer, tokenized_data = await summ_inference_tokenize(input_=txts, n_tokens=SUMM_INPUT_N_TOKENS)
     pred = summ_model.generate(**tokenized_data, max_new_tokens=SUMM_TARGET_N_TOKENS)
     result = ["" if t=="" else inference_tokenizer.decode(p, skip_special_tokens=True).strip() for t, p in zip(txts, pred)]

     return summ_tokenizer, summ_model
+def summ_preprocess(txt):
     txt = re.sub(r'^By \. [\w\s]+ \. ', ' ', txt) # By . Ellie Zolfagharifard .
     txt = re.sub(r'\d{1,2}\:\d\d [a-zA-Z]{3}', ' ', txt) # 10:30 EST
     txt = re.sub(r'\d{1,2} [a-zA-Z]+ \d{4}', ' ', txt) # 10 November 1990
 async def summ_inference(txts: str):
+    txts = [*map(summ_preprocess, txts)]
     inference_tokenizer, tokenized_data = await summ_inference_tokenize(input_=txts, n_tokens=SUMM_INPUT_N_TOKENS)
     pred = summ_model.generate(**tokenized_data, max_new_tokens=SUMM_TARGET_N_TOKENS)
     result = ["" if t=="" else inference_tokenizer.decode(p, skip_special_tokens=True).strip() for t, p in zip(txts, pred)]