Whisper

Autre

Comment utiliser Whisper (OpenAI) sur macOS ?

Cet article explique comment installer et utiliser Whisper d'OpenAI sur macOS via Homebrew, permettant ainsi de convertir des fichiers audio en texte localement. Il aborde les étapes d'installation, d'utilisation de la commande Whisper pour la transcription et met en garde sur l'utilisation élevée des ressources CPU lors du processus. De plus, il fait mention d'une méthode pour télécharger des messages vocaux de WhatsApp.

"
Autre

L'IA est-elle compatible avec le Libre ? - LinuxFr.org

Cet article discute de la compatibilité entre l'intelligence artificielle (IA) et les principes du logiciel libre. Il remet en question l'utilisation du terme 'IA' dans des projets libres, soulignant les implications idéologiques et les risques de centralisation du pouvoir. L'auteur aborde l'importance d'une terminologie précise et critique l'adoption de l'IA par des organismes favorisant le libre, tout en expliquant les subtilités des outils utilisés tels que Whisper d'OpenAI.

Autre

La reconnaissance vocale sous Linux (2024)

Cet article présente Speech Note, un logiciel de reconnaissance et synthèse vocale sous Linux, disponible via Flatpak, qui permet d'utiliser divers modèles vocaux tout en assurant la confidentialité des données. Testé sur un laptop à GPU intégré Intel, le logiciel offre de bonnes performances avec des modèles de taille raisonnable. Il propose également un modèle de traduction et tout le traitement se fait localement.

Autre

Reconnaissance vocale sur Android

Cet article présente Futo, un clavier virtuel pour Android offrant une reconnaissance vocale locale, sans connexion Internet. Il utilise le modèle Whisper d'OpenAI et assure la confidentialité des données en ne les envoyant pas sur le cloud. Le clavier est personnalisable et permet de transcrire la voix en texte depuis n'importe quelle application.

Fullstack

Adding Voice Recognition To A Web App

Cet article explique comment ajouter une fonctionnalité de reconnaissance vocale à une application web en utilisant le modèle Whisper de OpenAI, en intégrant l'API MediaStream Recording pour capturer le microphone de l'utilisateur. Les auteurs présentent également un composant Vue pour gérer l'enregistrement et la transcription de la voix de manière fluide. Bien que le modèle Whisper ait montré de bonnes performances, des améliorations sont nécessaires pour optimiser l'assistant AI, notamment la reconnaissance en temps réel et la mise en évidence des modifications de texte.