File size: 2,582 Bytes
81f5e64
 
 
 
 
 
 
 
 
 
 
 
53ce8ef
 
 
 
 
 
 
 
ae1ee58
 
53ce8ef
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
a241f5a
 
53ce8ef
 
a241f5a
53ce8ef
a241f5a
53ce8ef
 
 
 
 
a241f5a
53ce8ef
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
---
title: Classifieur
emoji: 👁
colorFrom: red
colorTo: blue
sdk: gradio
sdk_version: 5.23.3
app_file: app.py
pinned: false
short_description: 'Une application de classification de texte utilisant OpenAI '
---

# BrainBox4 - Système de Classification de Texte

Cette application gradio est un système de classification de texte basé sur l'IA, optimisé pour le traitement rapide de grands volumes de données.

## 🚀 Installation

1. Cloner le dépôt :
```bash
git clone https://github.com/simon-dharcourt/classifieur.git
cd classifieur
```

2. Installer les dépendances :
```bash
pip install -r requirements.txt
```

3. Configurer la clé API OpenAI (optionnel) :
   - Créer un fichier `.env` à la racine du projet
   - Ajouter votre clé API : `OPENAI_API_KEY=votre_clé_api`

## 💻 Utilisation

1. Lancer l'application :
```bash
python app.py
```

2. Accéder à l'interface web :
   - Ouvrir votre navigateur à l'URL indiquée dans la console.

3. Étapes d'utilisation :
   - Charger votre fichier Excel ou CSV
   - Sélectionner les colonnes à classifier
   - Définir les catégories
   - Lancer la classification

## 🏗 Architecture

```
brainbox4/
├── app.py              # Interface utilisateur
├── classifier.py       # Classification asynchrone
├── prompts.py         # Templates LLM
├── utils.py           # Utilitaires
└── requirements.txt   # Dépendances
```

## 🔧 Optimisations de Performance
- parallélisation des requêtes API par lot de 10 maximum pour accélérer la classification.
- suggestion automatique du modèle.

## 🎨 Optimisations de l'Interface Utilisateur
- Suggestion automatiques de catégories et de colonnes basées sur un échantillon de textes.
- Rapport d'évaluation détaillé après classification : analyse des catégories, détection des incohérences, suggestions d'amélioration.
- Suggestion de reclassification des textes selon les recommandations du rapport.

## ✨ Fonctionnalités Principales
1. **Classification Rapide**
   - Traitement parallèle des textes
   - Support des fichiers Excel/CSV
   - Scores de confiance et justification

2. **Interface Simple**
   - Upload de fichiers
   - Sélection des colonnes
   - Visualisation des résultats

## 🚀 Pistes d'Amélioration

1. **Déploiement Local**
   - Utilisation de modèles locaux via LiteLLM
   - Optimisation des appels aux LLMs pour accélérer la classification 

2. **Interface Avancée**
   - Application web dédiée (React/Vue)
   - Système de comptes utilisateurs
   - Historique des classifications