Vous aimeriez recevoir vos messages vocaux déjà transcrits, directement lisibles dans votre boîte Outlook ? Depuis plusieurs années, Microsoft a intégré à Teams et à Exchange Online un service de transcription quasi instantané baptisé Cloud Voicemail. Cette fonctionnalité tire parti de l’IA de reconnaissance vocale pour transformer le fichier audio en texte, ajouter la transcription au corps de l’e‑mail et ne laisser l’enregistrement MP3 qu’à titre de « pièce jointe de secours ». Ci‑dessous, découvrez pas à pas comment l’activer, l’optimiser et en connaître les limites.
Pourquoi passer à la transcription automatique ?
Lire un texte est souvent plus rapide (et plus discret) qu’écouter un message. De plus, la transcription :
- accélère la prise de connaissance des informations clés ;
- permet la recherche plein texte dans Outlook, Teams, Viva Topics, etc. ;
- facilite l’archivage et la conformité, le texte étant couvert par les politiques de rétention Exchange Online / Purview.
Fonctionnement en bref
- L’appel est acheminé vers la messagerie vocale ; le service enregistre l’audio.
- Une micro‑instance de reconnaissance vocale (ASR) convertit le flux en texte.
- Un e‑mail unique est créé : corps = transcription ; pièce jointe = fichier MP3.
- L’e‑mail est déposé dans la boîte Exchange de l’utilisateur et synchronisé vers tous les clients (Outlook, OWA, mobile, Teams).
Prérequis et paramètres clés côté admin
- Licence Teams Phone ou E5/E3 + Add‑on pour l’utilisateur.
- Messagerie vocale Cloud activée via une stratégie (par défaut, c’est le cas).
- Paramètre Transcription dans la stratégie : On.
- Langue de la boîte vocale définie dans le profil de l’utilisateur ; elle détermine la langue du prompt et du moteur ASR.
- Port TCP 443 ouvert vers les FQDN
*.teams.microsoft.com
et*.cloud.microsoft.com
(cas de SBC ou pare‑feu restrictifs).
Activer ou vérifier la transcription
Dans le Teams Admin Center :
- Voix ▸ Stratégies de messagerie vocale.
- Ouvrez la stratégie par défaut ; vérifiez que Transcription est sur Activée.
- Si besoin, créez une stratégie dédiée (par ex. pour un groupe pilote) ; attribuez‑la à l’utilisateur.
En PowerShell, la même manipulation se fait via :
Set-CsOnlineVoicemailPolicy -Identity Global -TranscriptionEnabled $true
Grant-CsOnlineVoicemailPolicy -PolicyName Global -Identity alice@contoso.com
Qualité de reconnaissance : facteurs et bonnes pratiques
La précision dépasse 90 % lorsque :
- les intervenants parlent distinctement ;
- le micro ne sature pas ;
- le niveau de bruit ambiant est faible ;
- la langue détectée fait partie des langues ASR prises en charge.
Évitez les call queues en cascade (plusieurs transferts) : cela ajoute un délai et peut tronquer les 2‑3 premières secondes du message, rendant la transcription moins pertinente.
Liste des langues prises en charge (août 2025)
Microsoft actualise régulièrement son moteur ; voici les langues officiellement supportées :
Famille | Langues | Commentaires |
---|---|---|
Occidental | anglais (US, UK, AU, CA), français, allemand, espagnol, italien, portugais, néerlandais, suédois, danois, norvégien, finnois | Reconnaissance la plus mature |
Est‑asiatique | japonais, coréen, mandarin, cantonais | Supporte la ponctuation intelligente |
Autres | arabe, hébreu, turc, polonais, tchèque, hongrois, roumain, thaï, indonésien | Accent régional parfois sensible |
Supprimer ou gérer la pièce jointe audio
La pièce jointe MP3 reste obligatoire en l’état ; cependant, on peut l’éliminer a posteriori :
- Règle Outlook côté client : « Lorsqu’un e‑mail a pour objet : « Message vocal de » → supprimer la pièce jointe ». Cela retire le MP3 sans toucher au texte.
- Power Automate (Flow) : utiliser le déclencheur « Lors de l’arrivée d’un nouvel e‑mail » ; extraire la transcription vers un fichier OneDrive ou un channel Teams, puis archiver ou supprimer l’audio selon la politique interne.
- Graph API : un script périodique peut repérer les messages
messageClass = IPM.Note.Microsoft.Voicemail
et purger les pièces jointes pour réduire l’espace.
Scénarios avancés
Boîte vocale partagée
Les Shared Mailboxes ne reçoivent pas automatiquement de transcription. Comme contournement, configurez un groupe de distribution d’alias et un flux Power Automate pour recopier le corps de l’e‑mail depuis la boîte personnelle vers la boîte partagée.
Conformité et e‑Discovery
La transcription et l’audio sont indexés dans le Content Search de Purview. Les mêmes politiques de rétention/litigation hold s’appliquent que pour tout message Exchange. Toutefois, vérifiez si la régulation locale impose une :
- notification préalable des salariés ;
- restriction sur l’export hors UE / EAA (RGPD, LOPI, etc.).
Protection de l’information (MIP)
Pour empêcher la diffusion du MP3, ajoutez un label de confidentialité « Interne » appliqué automatiquement à la classe de message vocale. La transcription restant du texte, elle peut être chiffrée avec le même label.
Désactivation ou ajustement de la transcription
Pour certains cadres dirigeants qui jugent la transcription trop sensible :
- Créez une stratégie Transcription Off ;
- Attribuez‑la uniquement aux comptes concernés via TAC ou PowerShell ;
- Validez que l’annulation est immédiate (un redémarrage Teams peut être requis côté client).
Si l’on souhaite désactiver entièrement la messagerie vocale, retirez la licence Teams Phone ou basculez les appels non répondus vers un standard humain / un répondant analogique.
Troubleshooting rapide
Pour les messages où seule la pièce jointe arrive :
- Vérifiez la langue : si inconnue, la transcription est ignorée.
- Analysez la qualité audio (> 16 kHz requis) ; réglez le micro ou le périphérique VoIP.
- Regardez les logs
ucwaCalls.log
côté client si l’utilisateur passe par un téléphone IP Teams‑certifié. - Effectuez le test Call Diagnostics dans TAC ▸ Voix ▸ Appels : la colonne VoiceMailTranscriptionStatus doit être à Success.
Alternatives hors Microsoft
• Google Voice : transcription en 11 langues ; le mail est rouvert dans Gmail mais peut être routé via POP vers Outlook.
• Twilio Voice + Speech to Text : offre un webhook ; on peut poster le texte dans un channel Teams via logique serverless.
• YouMail Enterprise : fournit la transcription + détection des appels spam, mais requiert la redirection conditionnelle des appels opérateur.
Questions/réponses fréquentes
La transcription compte‑t‑elle dans le quota Exchange ?
Oui : le corps HTML transcrit est stocké comme n’importe quel mail. Toutefois, le poids reste faible (< 30 Ko en moyenne).
Peut‑on corriger manuellement la transcription ?
Pas directement dans Teams. Il est possible d’utiliser la fonction « Ajouter des notes » dans Outlook pour placer une version corrigée au‑dessus du mail.
Le moteur apprend‑il des corrections ?
Non. La transcription repose sur un modèle global mis à jour par Microsoft mais ne s’adapte pas individuellement.
Bonnes pratiques pour un déploiement réussi
- Pilotez le service auprès d’un panel multilingue (10 à 15 personnes) avant un déploiement massif.
- Communiquez largement la possibilité de désactiver la transcription (respect vie privée).
- Documentez un guide « Expression » : parler clairement, éviter le haut‑parleur, mentionner son nom et la date en début de message.
- Planifiez un nettoyage automatique des MP3 au‑delà de 30 jours pour économiser le stockage.
- Audit annuel : vérifier que la transcription reste conforme aux exigences légales locales (ex. CNIL en France).
Conclusion
La transcription automatique de Cloud Voicemail offre un gain de productivité tangible : moins d’écoute fastidieuse, meilleure indexation, accessibilité accrue. Avec quelques réglages simples dans le Teams Admin Center et des scripts d’automatisation pour gérer les pièces jointes, vous transformez la messagerie vocale en un flux d’informations textuelles pleinement exploitable et conforme. En cas de contexte réglementaire ou de préférences personnelles particulières, la flexibilité des stratégies permet d’activer ou de désactiver la fonction au cas par cas — tout en maintenant un socle téléphonique moderne et centré sur l’expérience utilisateur.