Spaces:

mohitkumarrajbadi
/

Finetune_Gemma_Model

Build error

File size: 5,028 Bytes

2bdd84f

import streamlit as st
from utils import (
    load_model, 
    load_finetuned_model, 
    generate_response, 
    get_hf_token
)
import os
import json
from datetime import datetime

st.set_page_config(page_title="Gemma Chat", layout="wide")

# -------------------------------
# 💡 Theme Toggle
# -------------------------------
dark_mode = st.sidebar.toggle("🌙 Dark Mode", value=False)

if dark_mode:
    st.markdown(
        """
        <style>
        body { background-color: #1e1e1e; color: #ffffff; }
        .stTextInput, .stTextArea, .stSelectbox, .stSlider { color: #ffffff !important; }
        </style>
        """, unsafe_allow_html=True
    )

st.title("💬 Chat with Gemma Model")

# -------------------------------
# 📌 Model Source Selection
# -------------------------------
model_source = st.sidebar.radio("📌 Select Model Source", ["Local (.pt)", "Hugging Face"])

# -------------------------------
# 🔥 Dynamic Model List
# -------------------------------
if model_source == "Local (.pt)":
    model_dir = "models"
    if not os.path.exists(model_dir):
        os.makedirs(model_dir)

    local_models = [f for f in os.listdir(model_dir) if f.endswith(".pt")]

    if local_models:
        selected_model = st.sidebar.selectbox("🛠️ Select Local Model", local_models)
        model_path = os.path.join(model_dir, selected_model)
    else:
        st.warning("⚠️ No fine-tuned models found. Fine-tune a model first.")
        st.stop()

else:
    hf_models = [
        "google/gemma-3-1b-it", 
        "google/gemma-3-4b-pt", 
        "google/gemma-3-4b-it",
        "google/gemma-3-12b-pt", 
        "google/gemma-3-12b-it", 
        "google/gemma-3-27b-pt", 
        "google/gemma-3-27b-it"
    ]
    selected_model = st.sidebar.selectbox("🛠️ Select Hugging Face Model", hf_models)
    model_path = None

# -------------------------------
# 🔥 Model Loading
# -------------------------------
hf_token = get_hf_token()

if model_source == "Local (.pt)":
    tokenizer, model = load_model("google/gemma-3-1b-it", hf_token)  # Base model first
    model = load_finetuned_model(model, model_path)
    if model:
        st.success(f"✅ Local fine-tuned model loaded: `{selected_model}`")
    else:
        st.error("❌ Failed to load local model.")
        st.stop()

else:
    tokenizer, model = load_model(selected_model, hf_token)
    if model:
        st.success(f"✅ Hugging Face model loaded: `{selected_model}`")
    else:
        st.error("❌ Failed to load Hugging Face model.")
        st.stop()

# -------------------------------
# ⚙️ Model Configuration Panel
# -------------------------------
st.sidebar.header("⚙️ Model Configuration")
temperature = st.sidebar.slider("🔥 Temperature", 0.1, 1.5, 0.7, 0.1)
top_p = st.sidebar.slider("🎯 Top-p", 0.1, 1.0, 0.9, 0.1)
repetition_penalty = st.sidebar.slider("🔁 Repetition Penalty", 0.5, 2.0, 1.0, 0.1)

# -------------------------------
# 💬 Chat Interface
# -------------------------------
if "conversation" not in st.session_state:
    st.session_state.conversation = []

prompt = st.text_area("💬 Enter your message:", "Hello, how are you?", key="prompt", height=100)
max_length = st.slider("📏 Max Response Length", min_value=50, max_value=1000, value=300, step=50)

# -------------------------------
# 🚀 Streaming Response Function
# -------------------------------
def stream_response():
    """
    Streams the response token by token.
    """
    response = generate_response(prompt, model, tokenizer, max_length)

    if response:
        timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        st.session_state.conversation.append({"sender": "👤 You", "message": prompt, "timestamp": timestamp})
        st.session_state.conversation.append({"sender": "🤖 AI", "message": response, "timestamp": timestamp})
        return response
    else:
        st.error("❌ Failed to generate response.")
        return None

# -------------------------------
# 🎯 Conversation Controls
# -------------------------------
col1, col2, col3 = st.columns([1, 1, 1])

if col1.button("🚀 Generate (CTRL+Enter)", help="Use CTRL + Enter to generate"):
    stream_response()

if col2.button("🗑️ Clear Conversation"):
    st.session_state.conversation = []

# Export & Import
if col3.download_button("📥 Export Chat", json.dumps(st.session_state.conversation, indent=4), "chat_history.json"):
    st.success("✅ Chat exported successfully!")

uploaded_file = st.file_uploader("📤 Import Conversation", type=["json"])

if uploaded_file is not None:
    st.session_state.conversation = json.load(uploaded_file)
    st.success("✅ Conversation imported successfully!")

# -------------------------------
# 🛠️ Display Conversation
# -------------------------------
st.subheader("📜 Conversation History")

for msg in st.session_state.conversation:
    with st.container():
        st.markdown(f"**{msg['sender']}**  \n🕒 {msg['timestamp']}")
        st.write(msg['message'])