Spaces:

keras-io
/

text-generation

Build error

Jezia commited on Jun 19, 2022

Commit

a0f8996

1 Parent(s): 64f3f34

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ model = from_pretrained_keras("keras-io/text-generation-miniature-gpt")
 a = []
 word_to_index = {}
-a_file = open("imdb.vocab")
 for line in a_file:
   a.append(line.strip())
 print(len(a))
@@ -25,9 +25,11 @@ print(len(a))
 for index, word in enumerate(a):
     word_to_index[index] = word
-def text_process_pipeline(text): #pipeline
-  tokenizer = Tokenizer(num_words=80, split=' ')
-  tokenizer.fit_on_texts(word_to_index.values())
   processed_text = tokenizer.texts_to_sequences(start_prompt)
   processed_text = pad_sequences(processed_text, maxlen=80, padding='post')
   return processed_text

 a = []
 word_to_index = {}
+a_file = open("imdb.vocab") # get vocab tokens
 for line in a_file:
   a.append(line.strip())
 print(len(a))
 for index, word in enumerate(a):
     word_to_index[index] = word
+tokenizer = Tokenizer(num_words=80, split=' ')
+tokenizer.fit_on_texts(word_to_index.values()) # fit tokenizer on vocab tokens
+def text_process_pipeline(start_prompt): #pipeline
   processed_text = tokenizer.texts_to_sequences(start_prompt)
   processed_text = pad_sequences(processed_text, maxlen=80, padding='post')
   return processed_text