Développement de solutions de reconnaissance vocale hors ligne

2020-11-23 17:29:40

Introduction au développement de solutions de reconnaissance vocale hors ligne


 


La technologie de reconnaissance vocale automatique ASR (Automatic Speech Recognition) est basée sur la technologie de reconnaissance de listes de mots clés. Dans chaque processus de reconnaissance, le contenu vocal prononcé par l'utilisateur est converti en caractéristiques vocales à travers le spectre de fréquences, et les éléments de la liste de mots clés sont mis en correspondance un par un, et la meilleure correspondance est utilisée comme résultat de la reconnaissance. Par exemple, dans une application de téléphonie mobile, le contenu de cette liste de mots clés est le nom de la personne dans le répertoire téléphonique / la commande de menu du téléphone / le nom de la chanson dans la carte T, etc. Quel que soit le contenu de cette liste, l'utilisateur n'a qu'à définir le registre correspondant. Le contenu de l'élément correspondant à reconnaître peut être transmis au moteur de reconnaissance sous forme de caractères.


Le moteur de reconnaissance ne se soucie pas du contenu des mots-clés dans la liste de mots-clés, qui peuvent être des chaînes de caractères chinois telles que des commandes, des noms de personnes, des noms de chansons, des instructions d'utilisation, etc.


Le nombre maximum de mots pris en charge par chaque mot-clé est limité à 30 mots du point de vue de l'algorithme. Cependant, à partir de la situation réelle, lorsque les utilisateurs disent plus de 8 mots à la fois, ils apparaîtront presque certainement des fautes de frappe / manquant / prononçant plusieurs mots / hoquet / pauses, etc. Ces situations affecteront gravement la reconnaissance et provoqueront la reconnaissance. Erreur. Par conséquent, en général, si vous souhaitez obtenir un effet de reconnaissance idéal, il est recommandé que le nombre de mots de chaque mot-clé ne soit pas trop long pour ne pas affecter l'effet.


 


L'importance la plus importante de la technologie ASR est de fournir une interface utilisateur vocale sans boutons ni souris, ce qui rend le fonctionnement du produit par l'utilisateur plus naturel, plus rapide et plus pratique que le contrôle manuel, et peut être utilisé pour les appareils ménagers intelligents, les vêtements intelligents et les jouets intelligents à commande vocale. Et bien d'autres domaines.


À l'heure actuelle, le prix des solutions de reconnaissance vocale en ligne est relativement élevé, la période d'accès au produit est longue et le temps de réponse est affecté par le réseau. Cette solution permet une reconnaissance vocale hors ligne de la voix humaine non spécifique basée sur un grand nombre de bases de données vocales. Cette solution présente des avantages en termes de coûts, un accès simple, un cycle court, une vitesse de réponse d'identification rapide (en 0,5 seconde) et pas besoin de se connecter au réseau. La solution globale est mature, stable et fiable, permettant aux produits traditionnels de mettre à niveau rapidement la fonction vocale intelligente.


 


La technologie de reconnaissance vocale hors ligne est une technologie basée sur la reconnaissance de listes de mots clés. Il vous suffit de configurer une liste de mots clés à reconnaître, et les mots clés prononcés par l'utilisateur peuvent être reconnus via le système de reconnaissance vocale, sans aucune formation à l'enregistrement pour l'utilisateur.


Facile sans connexion Internet


Réalisez le contrôle vocal


 


Application du marché:


Lampes vocales intelligentes, jouets intelligents, appareils ménagers (ventilateurs électriques, hottes de cuisine, climatiseurs), appareils de massage pour les yeux, appareils de massage pour le cou, haut-parleurs intelligents et de nombreux autres produits.


 


Avantages de la solution:


Le taux de reconnaissance est supérieur à 95%, reconnaissance précise à une distance de 3 M


Prise en charge de 32 langues et plusieurs langues mineures


Pas besoin de se connecter à Internet, identification hors ligne, réponse rapide


Soutenir la diffusion de commentaires vocaux, augmenter le divertissement interactif


Performances élevées, architecture SOC, codec intégré


Puce de qualité industrielle de haute stabilité


Conception d'instruction flexible, pas besoin d'enregistrement client


Temps de développement court et support technique en place


 


Paramètres techniques:


La plage de tension de fonctionnement est en option 3,3 ~ 5,5 V


Broche MIC dédiée à l'entrée, le niveau amélioré est de 26 dB, le gain total maximal est de 65 dB


Sortie audio différentielle PWM, alimente directement les haut-parleurs 1W / 8Ω


2 sortie de signal PWM, peut être utilisée pour la gradation des LED


Fournir une interface I2C / UART et un protocole de communication personnalisé, qui peuvent être utilisés pour les modules externes et la communication avec MCU externe


 


 


méthode de coopération:


Fournir un plan de conception complet pour la reconnaissance vocale, les clients peuvent concevoir des fonctions en fonction de leurs propres besoins, notre société est responsable du développement de la partie commande vocale et de la connexion avec la commande principale du client


Autorisation de puce: les clients développent eux-mêmes des applications, produisent des circuits imprimés et achètent les composants correspondants pour la production.Notre société fournit des puces, des itinéraires de référence associés et des commandes de reconnaissance vocale.


 


cas de réussite:


1. Lumière vocale intelligente


2. Appareils ménagers intelligents


3. Masseur de santé


4. Contrôle central intelligent


 


Module de réduction du bruit vocal:


Supprimez efficacement le bruit ambiant et améliorez l'efficacité de la reconnaissance dans les environnements bruyants.


Convient aux produits à mouvement mécanique, tels que les ventilateurs, les radiateurs, les hottes de cuisine, les robots de balayage, etc.


 


 


Bienvenue à tous les ingénieurs de développement à venir consulter et comprendre.