DATA SCIENCE TOOLKIT

Une collection de modules Python open-source pour la détection d'anomalies, l'analyse de chaos et l'exploration astronomique par apprentissage actif.

Explorer les modules GitHub

MODULES

Trois outils puissants pour l'analyse de données complexes et la détection d'anomalies

Chaos Theory

ChaosTrace

Toolkit Python léger pour la détection de transitions de régime, d'événements de type "foil drop" et d'anomalies cachées dans des séries temporelles multivariées haute fréquence. Utilise la reconstruction d'espace de phase, l'analyse RQA et des métriques inspirées du chaos (Takens, Lyapunov proxy).

Phase Space RQA Lyapunov Matrix Profile Deep Learning Causal

⚡ Exemple d'utilisation

# Mode hybride : fusion chaos + Matrix Profile + causal
python -m chaostrace.cli.run_hybrid \
    --input telemetry.csv \
    --out results/ \
    --enable-mp \
    --enable-causal \
    --mp-col boat_speed
→ anomalies_hybrid.csv | metrics_hybrid.json | fig_timeline_hybrid.png
Active Learning

AstroOracle

Oracle à apprentissage actif pour le triage d'anomalies astronomiques. Récupère des cutouts SkyView, classe les candidats via score d'anomalie, acquisition et diversité. Interface CLI et web UI pour l'annotation, avec ré-entraînement automatique.

Active Learning SkyView Plotly 3D FastAPI Gaia Explainability

⚡ Exemple d'utilisation

# Lancer le serveur web avec dashboard interactif
astrooracle serve \
    --candidates candidates.parquet \
    --annotations annotations.csv

# Ouvrir http://127.0.0.1:8000/
→ Landing page Plotly 3D | Dashboard annotations | Graph anomaly | LIME explanations
Graph Analysis

AstroGraphAnomaly

Outil open-source pour détecter des sources astronomiques inhabituelles dans les données Gaia. Combine le scoring d'anomalies basé sur les features avec une analyse de graphe k-plus-proches-voisins sur la sphère céleste. Explainability LIME et génération de prompts LLM.

k-NN Graph Isolation Forest LOF LIME LLM Prompts GraphML

⚡ Exemple d'utilisation

# Workflow complet sur données Gaia
python run_workflow.py \
    --mode gaia \
    --ra 266.4051 \
    --dec -28.936175 \
    --radius-deg 0.5 \
    --limit 2000 \
    --out results/ \
    --plots \
    --explain-top 10
→ scored.csv | graph_topk.graphml | plots/*.png | explanations.jsonl | llm_prompts.jsonl