OniXinO commited on
Commit
c585309
·
1 Parent(s): 9000ced

Зміни:

Browse files

Використання google/mt5-small:
Замінено facebook/blenderbot-400M-distill на google/mt5-small.
Використовується AutoModelForSeq2SeqLM замість AutoModelForCausalLM, оскільки MT5 - це модель "sequence-to-sequence".
Виправлення padding_side:
Додано padding_side="left" при ініціалізації tokenizer, як рекомендовано в попередженні.

Files changed (1) hide show
  1. app.py +3 -3
app.py CHANGED
@@ -1,11 +1,11 @@
1
  import streamlit as st
2
- from transformers import AutoModelForCausalLM, AutoTokenizer
3
  import torch
4
 
5
  @st.cache_resource
6
  def load_model():
7
- tokenizer = AutoTokenizer.from_pretrained("facebook/blenderbot-400M-distill")
8
- model = AutoModelForCausalLM.from_pretrained("facebook/blenderbot-400M-distill")
9
  return tokenizer, model
10
 
11
  st.title("Український Чат-бот")
 
1
  import streamlit as st
2
+ from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
3
  import torch
4
 
5
  @st.cache_resource
6
  def load_model():
7
+ tokenizer = AutoTokenizer.from_pretrained("google/mt5-small", padding_side="left")
8
+ model = AutoModelForSeq2SeqLM.from_pretrained("google/mt5-small")
9
  return tokenizer, model
10
 
11
  st.title("Український Чат-бот")