|
# مجموعات البيانات
|
|
|
|
يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات.
|
|
|
|
## المجموعات المتوفرة
|
|
|
|
- `cost_data.csv`: بيانات تكاليف المشاريع السابقة
|
|
- `risk_data.csv`: بيانات المخاطر وتأثيراتها
|
|
- `local_content_data.csv`: بيانات المحتوى المحلي
|
|
- `documents_data.csv`: بيانات المستندات المصنفة
|
|
- `entities_data.csv`: بيانات الكيانات المستخرجة
|
|
|
|
## هيكل مجموعات البيانات
|
|
|
|
### cost_data.csv
|
|
|
|
بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع:
|
|
|
|
| العمود | الوصف | النوع |
|
|
|--------|-------|------|
|
|
| project_id | رقم المشروع | نص |
|
|
| project_type | نوع المشروع | نص |
|
|
| location | الموقع | نص |
|
|
| area | المساحة (م²) | رقم |
|
|
| floors | عدد الطوابق | رقم |
|
|
| duration_months | مدة التنفيذ (شهور) | رقم |
|
|
| tender_type | نوع المناقصة | نص |
|
|
| client_type | نوع العميل | نص |
|
|
| total_cost | إجمالي التكلفة | رقم |
|
|
| cost_per_sqm | تكلفة المتر المربع | رقم |
|
|
| material_cost | تكلفة المواد | رقم |
|
|
| labor_cost | تكلفة العمالة | رقم |
|
|
| equipment_cost | تكلفة المعدات | رقم |
|
|
| overhead_percentage | نسبة المصاريف العامة | رقم |
|
|
|
|
### risk_data.csv
|
|
|
|
بيانات المخاطر وتأثيراتها:
|
|
|
|
| العمود | الوصف | النوع |
|
|
|--------|-------|------|
|
|
| risk_id | رقم المخاطرة | نص |
|
|
| project_id | رقم المشروع | نص |
|
|
| risk_category | فئة المخاطرة | نص |
|
|
| risk_description | وصف المخاطرة | نص |
|
|
| impact | التأثير | نص |
|
|
| probability | الاحتمالية | نص |
|
|
| risk_score | درجة المخاطرة | رقم |
|
|
| response_strategy | استراتيجية الاستجابة | نص |
|
|
| actual_impact | التأثير الفعلي | نص |
|
|
| actual_cost | التكلفة الفعلية | رقم |
|
|
|
|
## الإحصاءات
|
|
|
|
- عدد المشاريع: 500+
|
|
- الفترة الزمنية: 2018-2024
|
|
- التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية
|
|
|
|
## الترخيص والقيود
|
|
|
|
هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة. |