Conexant Systems Inc. anunció CX20865, un nuevo sistema en chip (SoC) de procesador de entrada de voz de campo lejano de alto rendimiento diseñado específicamente para televisores inteligentes. El CX20865 es la primera solución dedicada de voz de campo lejano con un motor de reconocimiento automático de voz (ASR) integrado, optimizado para aplicaciones de telepresencia y control de voz. Conexant integra un ASR de terceros con un nuevo DSP de bajo consumo para admitir la función de activación por voz independiente incluso en el estado de apagado de los televisores inteligentes. Al combinar los algoritmos de preprocesamiento Far-Field Voice patentados de Conexant con un ADC integrado de alto rendimiento de 24 bits, el CX20865 agrega experiencias Watch Live and Talk™ diferenciadas en aplicaciones VoIP populares como Skype TV. Proporciona un rendimiento de control de voz preciso mientras ve Explotando ruidosamente. La nueva tecnología Selective Source Pickup™ mantiene el reconocimiento de voz a pesar de la interferencia ambiental aleatoria, lo que permite demostraciones en vivo en entornos minoristas y ferias comerciales. Conexant Systems Inc. anunció CX20865, un nuevo sistema en chip (SoC) de procesador de entrada de voz de campo lejano de alto rendimiento diseñado específicamente para televisores inteligentes. El CX20865 es la primera solución dedicada de voz de campo lejano con un motor de reconocimiento automático de voz (ASR) integrado, optimizado para aplicaciones de telepresencia y control de voz. Conexant integra un ASR de terceros con un nuevo DSP de bajo consumo para admitir la función de activación por voz independiente incluso en el estado de apagado de los televisores inteligentes. Al combinar los algoritmos de preprocesamiento Far-Field Voice patentados de Conexant con un ADC integrado de alto rendimiento de 24 bits, el CX20865 agrega experiencias Watch Live and Talk™ diferenciadas en aplicaciones VoIP populares como Skype TV. Proporciona un rendimiento de control de voz preciso mientras ve Explotando ruidosamente. La nueva tecnología Selective Source Pickup™ mantiene el reconocimiento de voz a pesar de la interferencia ambiental aleatoria, lo que permite demostraciones en vivo en entornos minoristas y ferias comerciales.
Puntos focales de la sala de estar, los televisores inteligentes se están convirtiendo en los nuevos centros para las interfaces humanas con otros dispositivos digitales y la nube. Voice es la interfaz manos libres natural e ideal para que los consumidores accedan e interactúen con televisores inteligentes. Desde el control remoto por voz básico hasta la búsqueda por voz avanzada, aplicaciones de navegación, redes sociales, chat y juegos. Sin embargo, para lograr la experiencia de televisión inteligente donde la voz promete a los usuarios, se debe considerar el ruido ambiental, el volumen de reproducción de la televisión y la distancia. Conexant trabaja en estrecha colaboración con los principales fabricantes de equipos originales de televisores para superar estos desafíos técnicos.
El nuevo hardware CX20865 cuenta con DSP de 32 bits de alto rendimiento y doble núcleo, procesamiento de transmisión de audio de subprocesos múltiples y ASR de terceros. Un DC/DC integrado proporciona características avanzadas de administración de energía. El dispositivo tiene USB de alta velocidad y E/S I2S para datos de audio e interfaces I2C y UART para control. La ruta de entrada de micrófono cuádruple se ha actualizado con un preamplificador de alto rendimiento y ADC de 24 bits para ofrecer una ruta completa con un rango dinámico de 106dB. Además, cada ruta de micrófono tiene una polarización de micrófono dedicada para evitar la diafonía.
El rendimiento del preprocesamiento de audio se ha mejorado para ofrecer una tasa de aciertos de ASR de más del 97 por ciento cuando los televisores reproducen sonidos a un volumen alto. La nueva cancelación de eco admite configuraciones de altavoces internos estéreo, 2.1CH y 2+2CH. La dereverberación mejorada y el verdadero procesamiento de banda ancha mejoran en gran medida la claridad perceptiva del habla. Con este fin, Conexant trabaja con los principales proveedores de ASR de la región para optimizar las tasas de aciertos y reducir los falsos positivos mediante el uso de motores ASR locales y basados en la nube.
El Watch Live and Talk destacado combina a la perfección conversaciones de voz y entretenimiento televisivo en una sola experiencia, lo que permite que dos personas “compartan el momento” viendo el mismo programa de televisión o uno diferente mientras conversan. Esta experiencia también se aplica al chat de voz mientras juegas juegos multipartidista en tu televisor sin conexión a tus auriculares.
Selective Source Pickup (SSP) es una tecnología innovadora para la supresión de ruido de campo lejano en entornos de ruido variables en el tiempo. SSP distingue a la audiencia prevista de la interferencia aleatoria de voz/ruido al separar múltiples fuentes de sonido. Esta tecnología está optimizada para aplicaciones ASR más allá de la emulación del sistema auditivo humano tradicional, que se limita a la inteligencia auditiva humana. “Escenarios como demostraciones en tiendas en tiendas minoristas grandes, abarrotadas y ruidosas han sufrido bajas tasas de éxito y falsos positivos”, dijo Jonathan Chien, director ejecutivo de marketing de Conexant. “Hemos adoptado un enfoque único utilizando la captación de fuente selectiva para abordar esta situación caótica. Ha mejorado mucho”.
“Conexant está a la vanguardia de la tecnología de procesamiento de voz de campo lejano”, dijo Saleel Awsare, vicepresidente y gerente general de Conexant. “Brindamos la única solución llave en mano, la experiencia y el soporte necesarios para permitir que nuestros socios OEM de televisores brinden la mejor experiencia en su clase que puede mantenerse al día con los avances en las interfaces de voz humana para televisores inteligentes”.
El CX20865 admite tres modos principales de usuario de voz:
Conversación: logre un habla clara y natural incluso en salas grandes. Experiencia comprobada con la certificación de Skype TV.
Comando y control: para la optimización de la tasa de aciertos de ASR basada en local. Voz que despierta.Eliminación de ruido y eco
Dictado de voz: optimización de la tasa de aciertos de ASR en lenguaje natural basado en la nube.Adaptación de la sala/escena
*Otras características clave incluyen: *
* Ver y hablar en vivo
* Recogida de fuente selectiva
* Optimización de la tasa de aciertos de múltiples proveedores
* Módulo de micrófono “oculto” preajustado para la estética y el rendimiento del diseño industrial
* Procesamiento de audio de campo lejano con AEC compatible con configuraciones estéreo, 2.1CH y 2+2 (tweeter y woofer)
* DSP de doble núcleo de 32 bits con datos integrados y memoria de programa
* DC/DC integrado para administración de energía
* Preamplificador de micrófono con ADC cuádruple de 24 bits y suministro de polarización de micrófono independiente
El CX20865 se ofrece en un paquete BGA de 9×9. EVK ahora está disponible para clientes y socios calificados por $500. El precio comienza en $5.50 por pieza en cantidades de 100,000.