Capturez votre écran, transcrivez automatiquement avec un modèle local ou cloud, et obtenez un résumé IA.
ARWI combine capture d'écran, transcription multi-moteurs et IA générative dans une seule app desktop.
Capture plein écran, multi-moniteurs ou région personnalisée. Audio multipiste : micro + son système (WASAPI loopback). Presets qualité (Low/Medium/High/Custom) avec estimation de taille en direct.
8 moteurs au choix : Whisper, Whisper-ONNX, Parakeet TDT en local — OpenAI, ElevenLabs Scribe, Mistral Voxtral, AssemblyAI, Deepgram en cloud.
Streaming WebSocket en temps réel pendant l'enregistrement (Deepgram, ElevenLabs, Mistral). Timestamps cliquables synchronisés avec la vidéo.
Détection automatique des intervenants avec couleurs distinctes. Native sur ElevenLabs, Mistral, AssemblyAI, Deepgram.
Génération de résumé avec points clés, sujets et actions à mener. 7 fournisseurs : OpenAI, Gemini, Claude, Mistral, Z.ai, Ollama, LM Studio.
Posez des questions sur le contenu de la réunion. L'IA répond en s'appuyant sur la transcription complète.
Étiquettes colorées, règles d'auto-tagging par regex sur le titre de fenêtre. Filtrage rapide depuis la sidebar.
ARWI vit dans la barre des tâches. Démarrage/arrêt depuis le menu, indicateur visuel pendant l'enregistrement.
Raccourci clavier configurable (par défaut Ctrl+Shift+R) pour démarrer/arrêter l'enregistrement depuis n'importe quelle application.
Système de logs structurés NDJSON façon loggingsucks.com. Trace IDs, sampling, viewer intégré dans les réglages.
Un clic, un raccourci clavier (Ctrl+Shift+R) ou une règle d'automatisation déclenche la capture. Choisissez vos écrans, votre micro et la qualité.
À l'arrêt, ARWI transcrit avec le moteur configuré. La transcription live affiche les segments en temps réel pendant la capture si activée.
ARWI génère automatiquement un résumé avec points clés, sujets et actions. Discutez ensuite avec l'IA pour creuser le contenu.
Performance native, transcription locale et UI moderne — au cœur de l'architecture.
Framework desktop ultra-léger avec backend Rust et frontend web.
UI réactive et typée pour une expérience fluide et maintenable.
Backend performant pour la capture audio/vidéo et la transcription locale.
Transcription locale via whisper-rs et sherpa-onnx — sans envoyer vos données.
Capture vidéo (gdigrab), encodage H.264 et muxing multipiste.
Styles utilitaires pour un design cohérent et personnalisable.
Conçu pour des sessions longues sans friction.
ARWI sera bientôt disponible.