Spaces:

thomson99
/

Arabic_Article_Assistant

Runtime error

App Files Files Community

thomson99 commited on Jan 18

Commit

847231a

verified ·

1 Parent(s): ba17bb4

Upload 2 files

Browse files

Files changed (2) hide show

app.py +45 -43
requirements.txt +2 -2

app.py CHANGED Viewed

@@ -7,9 +7,8 @@ from bidi.algorithm import get_display
 import re
 from collections import Counter
 from transformers import AutoTokenizer, AutoModelForCausalLM
-import wikipedia
-wikipedia.set_lang("ar")
-from duckduckgo_search import ddg
 # تهيئة النموذج
 try:
@@ -34,52 +33,55 @@ class ArticleGenerator:
         """البحث عن معلومات حول الموضوع"""
         results = []
-        # البحث في ويكيبيديا
         try:
-            wiki_results = wikipedia.search(topic)
-            for title in wiki_results[:2]:
-                try:
-                    page = wikipedia.page(title)
-                    results.append({
-                        'source': 'wikipedia',
-                        'title': page.title,
-                        'content': page.summary
-                    })
-                except:
-                    continue
-        except:
-            pass
-        # البحث في محرك DuckDuckGo
-        try:
-            ddg_results = ddg(topic, region='wt-wt', safesearch='Moderate', time='y', max_results=num_results)
-            for result in ddg_results:
-                results.append({
-                    'source': 'web',
-                    'title': result['title'],
-                    'content': result['body']
-                })
         except:
-            pass
         return results
     def extract_keywords(self, topic):
         """استخراج الكلمات المفتاحية من الموضوع"""
-        prompt = f"""
-        استخرج الكلمات المفتاحية المهمة المتعلقة بموضوع: {topic}
-        يجب أن تكون الكلمات مرتبطة بشكل مباشر بالموضوع ومفيدة للبحث.
-        """
-        inputs = self.tokenizer(prompt, return_tensors="pt").to(self.device)
-        outputs = self.model.generate(
-            inputs["input_ids"],
-            max_length=200,
-            temperature=0.7,
-            num_return_sequences=1
-        )
-        keywords = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
-        return [kw.strip() for kw in keywords.split(',')]
     def generate_content_with_research(self, topic, style):
         """توليد محتوى مبني على البحث"""
@@ -88,7 +90,7 @@ class ArticleGenerator:
         # البحث عن كل كلمة مفتاحية
         all_research = []
-        for keyword in keywords:
             search_results = self.search_topic(f"{topic} {keyword}")
             all_research.extend(search_results)

 import re
 from collections import Counter
 from transformers import AutoTokenizer, AutoModelForCausalLM
+import requests
+from bs4 import BeautifulSoup
 # تهيئة النموذج
 try:
         """البحث عن معلومات حول الموضوع"""
         results = []
         try:
+            # استخدام محرك بحث عربي
+            search_url = f"https://www.google.com/search?q={topic}&hl=ar"
+            headers = {
+                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
+            }
+            response = requests.get(search_url, headers=headers)
+            if response.status_code == 200:
+                soup = BeautifulSoup(response.text, 'html.parser')
+                search_results = soup.find_all('div', class_='g')
+                for result in search_results[:num_results]:
+                    title_elem = result.find('h3')
+                    snippet_elem = result.find('div', class_='VwiC3b')
+                    if title_elem and snippet_elem:
+                        results.append({
+                            'source': 'web',
+                            'title': title_elem.text,
+                            'content': snippet_elem.text
+                        })
         except:
+            # في حالة فشل البحث، استخدم محتوى افتراضي
+            results.append({
+                'source': 'default',
+                'title': f'معلومات عن {topic}',
+                'content': f'يعتبر موضوع {topic} من المواضيع المهمة في وقتنا الحاضر.'
+            })
         return results
     def extract_keywords(self, topic):
         """استخراج الكلمات المفتاحية من الموضوع"""
+        # قائمة من الكلمات المفتاحية المحتملة
+        potential_keywords = [
+            f"تعريف {topic}",
+            f"أهمية {topic}",
+            f"فوائد {topic}",
+            f"أنواع {topic}",
+            f"مميزات {topic}",
+            f"تطبيقات {topic}",
+            f"تاريخ {topic}",
+            f"مستقبل {topic}",
+            f"تحديات {topic}",
+            f"حلول {topic}"
+        ]
+        return potential_keywords
     def generate_content_with_research(self, topic, style):
         """توليد محتوى مبني على البحث"""
         # البحث عن كل كلمة مفتاحية
         all_research = []
+        for keyword in keywords[:3]:  # نأخذ أول 3 كلمات مفتاحية فقط
             search_results = self.search_topic(f"{topic} {keyword}")
             all_research.extend(search_results)

requirements.txt CHANGED Viewed

@@ -1,7 +1,7 @@
 transformers>=4.30.0
 torch>=2.0.0
-wikipedia-api>=0.5.8
-duckduckgo-search>=3.0.0
 gradio>=4.0.0
 python-dotenv==1.0.0
 sentencepiece==0.1.99

 transformers>=4.30.0
 torch>=2.0.0
+requests>=2.25.1
+beautifulsoup4>=4.9.3
 gradio>=4.0.0
 python-dotenv==1.0.0
 sentencepiece==0.1.99