OniXinO
commited on
Commit
·
c585309
1
Parent(s):
9000ced
Зміни:
Browse filesВикористання google/mt5-small:
Замінено facebook/blenderbot-400M-distill на google/mt5-small.
Використовується AutoModelForSeq2SeqLM замість AutoModelForCausalLM, оскільки MT5 - це модель "sequence-to-sequence".
Виправлення padding_side:
Додано padding_side="left" при ініціалізації tokenizer, як рекомендовано в попередженні.
app.py
CHANGED
@@ -1,11 +1,11 @@
|
|
1 |
import streamlit as st
|
2 |
-
from transformers import
|
3 |
import torch
|
4 |
|
5 |
@st.cache_resource
|
6 |
def load_model():
|
7 |
-
tokenizer = AutoTokenizer.from_pretrained("
|
8 |
-
model =
|
9 |
return tokenizer, model
|
10 |
|
11 |
st.title("Український Чат-бот")
|
|
|
1 |
import streamlit as st
|
2 |
+
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
|
3 |
import torch
|
4 |
|
5 |
@st.cache_resource
|
6 |
def load_model():
|
7 |
+
tokenizer = AutoTokenizer.from_pretrained("google/mt5-small", padding_side="left")
|
8 |
+
model = AutoModelForSeq2SeqLM.from_pretrained("google/mt5-small")
|
9 |
return tokenizer, model
|
10 |
|
11 |
st.title("Український Чат-бот")
|