Comment fonctionne la traduction vocale en temps réel de Google Meet et quand sera-t-elle disponible en Italie ?

Un mois après son annonce lors de la Google I/O , la fonction de traduction vocale en temps réel de Google Meet débarque officiellement en Italie avec une rapidité de diffusion inhabituelle, même chez les géants de la technologie. Basée sur les modèles audio Google DeepMind , cette nouvelle fonctionnalité « double » les voix avec une latence minimale, préservant le ton et l'émotion d'origine. Elle est déjà active dans les combinaisons anglais-italien et vice-versa . Actuellement réservée aux abonnés Google AI Pro (un mois gratuit puis 21,99 euros par mois) et AI Ultra (249,99 $ par mois, pour l'instant uniquement aux États-Unis ), elle sera bientôt disponible pour les clients professionnels de Workspace, et d'autres langues seront disponibles dans les semaines à venir. Cette stratégie de déploiement échelonnée et adaptée à différents types d'utilisateurs permettra de recueillir des retours avant sa diffusion auprès de l'ensemble des utilisateurs de Meet.
De l'I/O 2025 au déploiement italienLors de la conférence Google I/O mi-mai – vous trouverez d'ailleurs ici toutes les nouvelles fonctionnalités annoncées –, l'entreprise a présenté une démonstration en direct de Meet, permettant une traduction instantanée des voix de l'anglais vers l'espagnol, sans perte d'intonation ni de rythme. Le 12 juin, lors du Google Cloud Summit de Milan, la même technologie a été mise à disposition des utilisateurs italiens, ouvrant ainsi la phase de déploiement progressif pour les utilisateurs de notre pays. Ou plutôt, pour tous ceux qui souhaitent utiliser la traduction italien-anglais et vice-versa sur Meet, partout dans le monde.
Comment fonctionne le « doublage en direct »La traduction ne se limite pas à la transcription et au sous-titrage : le modèle audio neuronal de référence (appelé AudioLM ) reconnaît la voix, génère la traduction et la régénère en temps réel avec le timbre, l'intonation, l'inflexion et les nuances identiques à ceux du locuteur. C'est objectivement l'étape la plus impressionnante. Le résultat est un effet de voix off naturel, avec un léger arrière-plan de l'original pour préserver le contact humain. La latence et la qualité sont comparables à une pause de conversation normale.
Il est possible de traduire dans les deux sens entre l'anglais et l'italien ; les combinaisons anglais-espagnol, présentées lors de la démonstration lors de l'événement californien, resteront également opérationnelles. Google a confirmé que l'allemand et le portugais seront les prochaines langues à être ajoutées d'ici l'été.
Où est le bouton (et pourquoi vous ne le voyez pas encore)Lors de la réunion, un badge « Traduction vocale » apparaît à côté des outils. Choisissez simplement la langue que vous parlez et celle que vous préférez écouter ; si votre interlocuteur choisit une autre langue, la traduction démarre automatiquement. Les personnes qui utilisent la fonction pour la première fois doivent donner leur consentement explicite à la traduction de leur voix. Google garantit que le traitement vocal est conforme au Règlement général sur la protection des données (RGPD) et aux dispositions du Digital Markets Act (l'un des deux règlements qui, avec le Digital Services Act, régit l'écosystème des services numériques dans l'UE), avec des contrôles précis sur les opt-in et le chiffrement de bout en bout . De fait, même comparée à des propositions similaires présentées par d'autres géants, de Microsoft à Apple, la version italienne a été citée comme un exemple de conformité aux règles, avec un déploiement plus rapide que sur le marché américain. Malgré les critiques concernant l'hyper-réglementation , également confiées à Italian Tech par le PDG de Google, Sundar Pichai, lors de la conférence I/O en mai.
La feuille de route comprend l'intégration de Gemini Live (l'assistant conversationnel multimodal également annoncé lors de la conférence I/O) pour traduire également les signaux visuels partagés lors des appels vidéo. L'objectif est d'atteindre des dizaines de langues d'ici 2026.
repubblica