Principal La technologie

Technologie de reconnaissance vocale

Technologie de reconnaissance vocale
Technologie de reconnaissance vocale

Vidéo: Chronique - Comment ça Marche ? La reconnaissance vocale, comment ça marche ? 2024, Juin

Vidéo: Chronique - Comment ça Marche ? La reconnaissance vocale, comment ça marche ? 2024, Juin
Anonim

Reconnaissance vocale, capacité des appareils à répondre aux commandes vocales. La reconnaissance vocale permet le contrôle mains libres de divers appareils et équipements (une aubaine particulière pour de nombreuses personnes handicapées), fournit une entrée pour la traduction automatique et crée une dictée prête à imprimer. Les systèmes téléphoniques automatisés et les logiciels de dictée médicale comptent parmi les premières applications de la reconnaissance vocale. Il est fréquemment utilisé pour la dictée, pour interroger des bases de données et pour donner des commandes à des systèmes informatiques, en particulier dans les professions qui s'appuient sur des vocabulaires spécialisés. Il permet également aux assistants personnels dans les véhicules et les smartphones, tels que Siri d'Apple.

Avant qu'une machine puisse interpréter la parole, un microphone doit traduire les vibrations de la voix d'une personne en un signal électrique ondulé. Ce signal est à son tour converti par le matériel du système - par exemple, la carte son d'un ordinateur - en un signal numérique. C'est le signal numérique qu'un programme de reconnaissance vocale analyse afin de reconnaître des phonèmes séparés, les éléments de base de la parole. Les phonèmes sont ensuite recombinés en mots. Cependant, de nombreux mots sonnent de la même manière et, pour sélectionner le mot approprié, le programme doit s'appuyer sur le contexte. De nombreux programmes établissent le contexte grâce à l'analyse des trigrammes, une méthode basée sur une base de données de grappes fréquentes de trois mots dans laquelle des probabilités sont attribuées pour que deux mots quelconques soient suivis d'un troisième mot donné. Par exemple, si un locuteur dit «qui suis», le mot suivant sera reconnu comme le pronom «je» plutôt que comme un «œil» de consonance similaire mais moins probable. Néanmoins, une intervention humaine est parfois nécessaire pour corriger les erreurs.

Les programmes de reconnaissance de quelques mots isolés, tels que les systèmes de navigation vocale par téléphone, fonctionnent pour presque tous les utilisateurs. D'un autre côté, les programmes vocaux continus, tels que les programmes de dictée, doivent être formés pour reconnaître les schémas vocaux d'un individu; la formation implique que l'utilisateur lise à haute voix des échantillons de texte. Aujourd'hui, avec la puissance croissante des ordinateurs personnels et des appareils mobiles, la précision de la reconnaissance vocale s'est nettement améliorée. Les taux d'erreur ont été réduits à environ 5% dans les vocabulaires contenant des dizaines de milliers de mots. Une précision encore plus grande est atteinte dans des vocabulaires limités pour des applications spécialisées telles que la dictée de diagnostics radiologiques.