1 août 2024
/
TUTORIELS
Vos transcriptions (audio en texte) 100% automatisées avec Assembly AI - TUTORIEL COMPLET
Vos transcriptions (audio en texte) 100% automatisées avec Assembly AI - TUTORIEL COMPLET
Dans un monde et une économie où les contenus audio et vidéo prolifèrent, la capacité à transcrire rapidement et efficacement ces médias en texte devient un atout majeur. L'automatisation de la transcription peut transformer votre façon de travailler, que vous soyez :
un professionnel cherchant à optimiser vos comptes rendus de réunions,
un chercheur souhaitant analyser des heures d’entretiens,
un créateur de contenu désireux d’optimiser et valoriser son contenu,
ou simplement quelqu'un qui souhaite gagner du temps,
…
C'est là qu'interviennent des outils puissants comme Assembly AI, offrant des solutions “Speech-to-text” performantes pour automatiser vos transcriptions.
Cette vidéo est un guide écrit complet faisant suite au tutoriel réalisé sur notre chaîne YouTube. La vidéo est disponible juste ici. 👈
Pourquoi automatiser vos transcriptions ?
Les avantages de la transcription automatique
L'automatisation de vos transcriptions présente de nombreux avantages :
Gain de temps considérable
Précision accrue par rapport à la transcription manuelle
Possibilité de traiter de grands volumes de contenu (plusieurs heures)
Facilité d'accès à l'information contenue dans les fichiers audio et vidéo
Amélioration de l'accessibilité de votre contenu
Les défis de la transcription manuelle
La transcription manuelle, bien que précise, présente plusieurs inconvénients :
Chronophage
Sujette aux erreurs humaines
Difficile à mettre à l'échelle pour de grandes quantités de contenu
Coûteuse si externalisée
Présentation des outils : Assembly AI et Make
Assembly AI : La puissance de l'IA au service de la transcription
Assembly AI est une plateforme d'intelligence artificielle spécialisée dans la conversion de la parole en texte. Ses caractéristiques principales incluent :
Une précision remarquable dans la transcription
La prise en charge de multiples langues
Des fonctionnalités avancées comme la détection des locuteurs et la ponctuation automatique
Une API facile à intégrer dans divers flux de travail
Pour ceux qui sont intéressés par d'autres outils d'IA innovants, notre guide complet sur Perplexity AI présente un moteur de recherche boosté à l'IA qui peut grandement optimiser vos recherches et votre création de contenus, complémentant parfaitement l'utilisation d'Assembly AI pour la transcription.
Make : L'automatisation à portée de main
Make (anciennement Integromat) est une plateforme d'automatisation qui permet de connecter différentes applications et services. Ses atouts sont :
Une interface visuelle intuitive pour créer des flux de travail
Plus de 1000 applications intégrées
La possibilité de créer des scénarios d'automatisation complexes sans codage
Une flexibilité permettant de s'adapter à divers besoins professionnels
Si vous êtes intéressé par l'automatisation de la création de contenu au-delà de la transcription, notre article sur la construction d'une machine à contenus automatisée vous montrera comment utiliser Make en conjonction avec d'autres outils d'IA pour générer automatiquement des posts, articles de blog, newsletters et plus encore.
Mise en place de l'automatisation
Étape 1 : Création d'un compte sur Assembly AI et Make
Pour commencer, vous devrez créer des comptes sur les deux plateformes :
Rendez-vous sur le site d'Assembly AI et inscrivez-vous
Faites de même sur la plateforme Make (inscrivez-vous via ce lien pour nous soutenir !)
Étape 2 : Obtention de la clé API d'Assembly AI
La clé API est essentielle pour connecter Assembly AI à Make :
Connectez-vous à votre compte Assembly AI
Naviguez vers la section "API Keys"
Générez une nouvelle clé API
Copiez cette clé et conservez-la précieusement
Étape 3 : Configuration de Make
Dans Make, vous allez créer un nouveau scénario :
Cliquez sur "Créer un nouveau scénario"
Choisissez Google Drive comme premier module (pour surveiller l'arrivée de nouveaux fichiers) puis "Watch Files in a Folder"
Choisissez comme “trigger de déclenchement” la fonction “On demand” afin que l’automatisation ne se déclenche que lorsque que vous le souhaitez. Si vous souhaitez que cette automatisation se déclenche selon une heure ou une récurrence précise, vous pouvez également le préciser (soyez vigilants dans ce cas aux coûts de consommation).
Configurez les paramètres de Google Drive (dossier à surveiller, types de fichiers, etc.)
Créez un nouveau module "Download a File" qui vous permettra de "télécharger" vos fichiers déposés dans le drive afin qu'ils soient anlysés par AssemblyAI. Sélectionnez bien la variable "File ID" pour faire le lien avec votre précédent module
Étape 4 : Intégration d'Assembly AI dans Make
Maintenant, ajoutez Assembly AI à votre flux :
Ajoutez un nouveau module après Google Drive
Recherchez et sélectionnez Assembly AI
Choisissez l'action "Transcribe an Audio File"
Connectez Assembly AI en collant votre clé API dans le champ approprié
Configurez les options de transcription en choisissant la langue souhaitées ainsi que l'ajout (ou non) de ponctuation. Si votre transcription est en anglais, vous serez également en mesure de directement sélectionner des options comme la détection de sujets, le résumé de contenu, l'identification des chapitres et participants, etc.
Dans la rubrique "Audio URL" vous devez ici sélectionner la variable "Web Content Link" issue du précédent module de téléchargement :
Étape 5 : Configuration de la sortie
Décidez comment vous souhaitez recevoir vos transcriptions :
Ajoutez un module Google Docs "Create a new document" pour créer un nouveau document avec la transcription
Indiquez bien que le contenu du document doit être le résultat de la retranscription en utilisant la variable suivante :
Vous pouvez également choisir quel nom de fichier vous souhaitez attribuer au document
Vous pouvez également opter pour un module d'e-mail pour recevoir (ou envoyer à une autre personne) le fichier contenant la transcription par mail. Pour ce faire vous devez ici ajouter un destinataire (Email address 1), ajouter un objet d'email (via Subject) ainsi qu'un contenu en utilisant le message que vous souhaitez suivi de la variable "Web View Link" qui exporte le lien du document google doc.
Tout est prêt !
Vous n'avez maintenant plus qu'à :
déposer un fichier audio sur votre dossier google drive
vous rendre sur MAKE et cliquer sur "RUN ONCE".
attendre quelques secondes puis profiter de votre transcription
Le mieux dans tout ça : c'est gratuit !
Les plans gratuits de MAKE, Google et Assembly AI vont vous permettre de créer gratuitement cette automatisation. Vous avez jusqu'à 100h de retranscription gratuite avec votre compte Assembly AI.
Pratique non? ;)
Utilisation avancée : Lemur pour l'analyse de contenu
Qu'est-ce que Lemur ?
AssemblyAI va au-delà de la simple transcription. Sa fonctionnalité Lemur agit comme un assistant d'analyse de contenu. Extraction de mots-clés, résumés automatiques, analyse de sentiment... Lemur transforme vos transcriptions en informations pleinement exploitables pour en créer les documents ou contenus que vous souhaitez.
Vous pouvez ainsi créer un workflow où chaque nouvel enregistrement dans votre drive est automatiquement transcrit, analysé, et transformé en un document structuré prêt à l'emploi. Cette configuration est simple à mettre en place, même sans compétences techniques avancées.
Que vous soyez un créateur de contenu cherchant à améliorer votre productivité, un professionnel voulant optimiser vos réunions, ou un chercheur analysant des heures d'entretiens, AssemblyAI et Make peuvent transformer votre approche de la transcription et de l'analyse audio.
Lemur qui permet d'analyser le contenu transcrit :
Extraction de mots-clés
Résumé automatique
Analyse de sentiment
Détection de sujets
…
Intégration de Lemur dans votre flux Make
Pour tirer parti de Lemur :
Ajoutez un module Lemur "Run a Task using LeMur" après le module de transcription dans Make
Configurez d'abord le prompt afin que ce dernier utilise le transcript et vous sorte le contenu de votre choix. Dans l'exemple utilisé ici, nous souhaitons créer un compte rendu de réunion complet (le prompt est disponible sur le groupe SKOOL)
Remplissez les variables "Input Text" et "Final Model" avec les informations ci-dessous :
Et voilà qui est fait ! Désormais votre automatisation :
analyse le fichier déposé dans Google Drive
réalise le transcript
rédige un contenu sur-mesure en utilisant le transcript (compte rendu de réunion, article de blog, post pour réseaux sociaux…)
L'utilisation de LeMur reste cependant payante (faible coût). Voici le tableau des consommations ci-dessous :
Personnalisation des prompts pour LeMur
Optimisez l'analyse en personnalisant les prompts :
Créez des prompts spécifiques à votre domaine ou type de contenu
Utilisez des mots-clés pertinents pour guider l'analyse
Expérimentez avec différentes formulations pour affiner les résultats
Optimisation de votre flux de travail
Automatisation des tâches post-transcription
Une fois la transcription obtenue, automatisez les étapes suivantes :
Formatage automatique du texte
Création de sous-titres pour les vidéos
Génération de contenu dérivé (articles de blog, posts sur les réseaux sociaux)
Intégration avec d'autres outils
Exploitez la puissance de Make pour connecter d'autres services :
Slack pour des notifications en temps réel
Trello ou Asana pour la gestion de tâches liées aux transcriptions
WordPress pour publier directement du contenu basé sur les transcriptions
Considérations de sécurité et de confidentialité
Protection des données sensibles
Lorsque vous travaillez avec des transcriptions, gardez à l'esprit :
La confidentialité des informations transcrites
Les réglementations sur la protection des données (RGPD, etc.)
La sécurité des transferts de fichiers entre les différentes plateformes
Bonnes pratiques pour une utilisation sécurisée
Adoptez ces habitudes pour une utilisation sûre :
Utilisez des connexions sécurisées (HTTPS) lors de la configuration
Limitez l'accès aux transcriptions aux personnes autorisées
Supprimez régulièrement les fichiers audio/vidéo et les transcriptions non nécessaires
Mettez à jour régulièrement vos mots de passe et clés API
Analyse des coûts et retour sur investissement
Comprendre la structure tarifaire
Avant de vous lancer, examinez attentivement :
Les coûts d'Assembly AI (par heure de transcription)
Les frais d'abonnement à Make
Les éventuels coûts supplémentaires (stockage Google Drive, etc.)
Calcul du retour sur investissement
Pour évaluer la rentabilité de cette solution :
Estimez le temps gagné grâce à l'automatisation
Comparez avec le coût de la transcription manuelle ou externalisée
Prenez en compte les bénéfices indirects (amélioration de la productivité, nouvelles opportunités, etc.)
Cas d'utilisation concrets
Pour les créateurs de contenu
Les podcasters et YouTubers peuvent :
Générer automatiquement des sous-titres
Créer des articles de blog basés sur leurs épisodes
Extraire des citations percutantes pour les réseaux sociaux
Pour aller plus loin dans l'automatisation de la création de contenu, notre tutoriel sur la “construction d'une machine à contenus 100% automatisée” vous montrera comment combiner Assembly AI avec d'autres outils d'IA pour créer un flux de travail entièrement automatisé, de la transcription à la publication.
Dans le monde de l'entreprise
Les professionnels peuvent optimiser :
La transcription des réunions et des appels clients
L'analyse des feedbacks clients à partir d'appels enregistrés
La création de documentation interne basée sur des présentations orales
Dans le domaine académique
Les chercheurs et étudiants peuvent bénéficier de :
La transcription automatique d'entretiens de recherche
L'analyse de conférences et de cours enregistrés
La création de notes structurées à partir de discussions académiques
Résolution des problèmes courants
Que faire en cas d'erreurs de transcription ?
Si vous rencontrez des imprécisions :
Vérifiez la qualité audio de vos fichiers source
Ajustez les paramètres de transcription dans Assembly AI
Envisagez un post-traitement manuel pour les contenus critiques
Gestion des interruptions de service
En cas de problème technique :
Vérifiez le statut des services (Assembly AI et Make)
Consultez les logs d'erreur dans Make
Contactez le support technique si le problème persiste
L'avenir de la transcription automatisée
Tendances émergentes
Gardez un œil sur ces développements futurs :
L'amélioration continue de la précision grâce à l'apprentissage profond (plus connu sous le nom “deep learning”)
L'intégration de la reconnaissance des émotions dans l'analyse vocale
La transcription en temps réel pour les applications en direct (streaming instantané)
Prêt à retranscrire votre succès ?
L'automatisation de vos transcriptions avec Assembly AI vous ouvre un monde infini de possibilités. En vous libérant du temps précieux et en transformant le contenu audio en ressources textuelles exploitables, vous pouvez vous concentrer sur ce qui compte vraiment : créer, innover, et exceller dans votre domaine.
Que vous soyez un créateur de contenu cherchant à valoriser son contenu ou élargir votre audience, un professionnel visant à optimiser vos processus, ou un chercheur désireux d'analyser des données qualitatives, cette solution d'automatisation peut être la clé pour débloquer tout le potentiel de vos contenus.
Si vous souhaitez approfondir vos connaissances sur l'IA et son utilisation dans divers domaines, nous vous invitons à rejoindre notre communauté "L'Atelier de l'IA" sur SKOOL. Nous y partageons des ressources gratuites, des templates YouTube, et discutons ensemble avec les membres sur l’implantation de l’IA dans leur business.
Pour rester à jour sur les dernières nouveautés en matière d'IA, n'oubliez pas de vous abonner à notre newsletter "L'Observatoire de l'IA". Chaque semaine, vous recevrez un résumé concis des actualités et des mises à jour importantes dans le domaine de l'IA.
Maintenant que vous avez les clés, c’est à vous d’explorer les possibilités offertes par cette synergie entre l'IA et l'automatisation. Après tout, ce n'est pas seulement ce que vous dites qui compte, mais aussi comment vous le capturez, l'analysez et l'utilisez.
Alors, êtes-vous prêt à donner voix à vos idées ? À vous de jouer !
Si vous avez des questions spécifiques sur l'intégration de l'IA dans votre workflow ou si vous cherchez des solutions personnalisées, n'hésitez pas à nous contacter via notre formulaire de contact.
FAQ : questions sur l'automatisation des transcriptions
Quelle est la précision des transcriptions d’Assembly AI ? Assembly AI offre une précision élevée, généralement supérieure à 95% pour des enregistrements de bonne qualité. Cependant, la précision peut varier en fonction de facteurs tels que la qualité audio, les accents, et le bruit de fond.
Combien de temps faut-il pour transcrire une heure d’audio ? Avec l’automatisation via Make et Assembly AI, la transcription d’une heure d’audio peut être réalisée en quelques minutes, bien que le temps exact puisse varier selon la charge du système et la complexité du contenu.
Puis-je utiliser cette solution pour des langues autres que le français ? Oui, Assembly AI prend en charge plusieurs langues. Vérifiez la liste des langues supportées sur leur site web pour vous assurer que votre langue cible est disponible.