Spaces:
Sleeping
Sleeping
import urllib.parse | |
import requests | |
import gradio as gr | |
from transformers import pipeline, MBart50Tokenizer | |
# 🟢 API Templates للحصول على بيانات ويكيبيديا | |
SEARCH_TEMPLATE = "https://ar.wikipedia.org/w/api.php?action=opensearch&search=%s&limit=1&namespace=0&format=json" | |
CONTENT_TEMPLATE = "https://ar.wikipedia.org/w/api.php?format=json&action=query&prop=extracts&exintro&explaintext&redirects=1&titles=%s" | |
# 🔥 استخدام tokenizer الصحيح | |
tokenizer = MBart50Tokenizer.from_pretrained("facebook/mbart-large-50", use_fast=False) | |
summarizer = pipeline("summarization", model="facebook/mbart-large-50", tokenizer=tokenizer) | |
def search_wikipedia(query): | |
""" البحث في ويكيبيديا العربية وإرجاع ملخص من المقال الأول. """ | |
query_encoded = urllib.parse.quote_plus(query) | |
search_response = requests.get(SEARCH_TEMPLATE % query_encoded).json() | |
if not search_response or not search_response[1]: | |
return "❌ لم يتم العثور على نتائج.", "" | |
# 🟢 جلب أول نتيجة | |
page_title = search_response[1][0] | |
page_encoded = urllib.parse.quote_plus(page_title) | |
# 🟢 جلب محتوى المقالة | |
content_response = requests.get(CONTENT_TEMPLATE % page_encoded).json() | |
pages = content_response.get("query", {}).get("pages", {}) | |
if not pages: | |
return "❌ لم يتم العثور على المحتوى.", "" | |
content = list(pages.values())[0].get("extract", "") | |
if not content: | |
return "❌ المقالة لا تحتوي على معلومات كافية.", "" | |
# 🟢 ضبط طول الإدخال للتوافق مع حدود النموذج | |
max_input_length = 1024 | |
content = content[:max_input_length] | |
# 🟢 تحسين التلخيص بناءً على طول المقالة | |
max_length = 200 if len(content) > 1000 else 100 | |
min_length = 50 if len(content) > 500 else 30 | |
summary = summarizer(content, max_length=max_length, min_length=min_length, do_sample=False)[0]['summary_text'] | |
source = search_response[3][0] # رابط المقال الأصلي | |
return summary, source | |
def chatbot_response(message, history): | |
""" دالة التفاعل مع المستخدم """ | |
summary, source = search_wikipedia(message) | |
response = f"🔹 **ملخص ويكيبيديا:**\n\n{summary}" | |
if source: | |
response += f"\n\n🔗 **المصدر:** [اضغط هنا]({source})" | |
history.append((message, response)) | |
return history | |
# 🔥 واجهة Gradio المحسنة | |
with gr.Blocks() as demo: | |
gr.Markdown("# 🤖 بوت ويكيبيديا العربية") | |
gr.Markdown("🔹 هذا البوت يستخدم ويكيبيديا العربية للبحث عن المعلومات وإعطاء ملخص عنها.") | |
chatbot = gr.Chatbot() | |
msg = gr.Textbox(label="🔍 اكتب سؤالك هنا:") | |
clear = gr.Button("🧩 مسح المحادثة") | |
msg.submit(chatbot_response, [msg, chatbot], chatbot).then( | |
lambda _: "", None, [msg], queue=False # 🟢 تصحيح التحديث التلقائي لحقل الإدخال | |
) | |
clear.click(lambda: [], None, chatbot, queue=False) | |
if __name__ == "__main__": | |
demo.launch(share=True) # 🟢 تمكين المشاركة العامة | |