Darius Baruo
19 dic 2025 02:12
Together AI anuncia la integración de los modelos Rime Arcana v2 y Mist v2 para mejorar las capacidades de texto a voz, ofreciendo mayor expresividad y control de pronunciación para aplicaciones empresariales.
Together AI ha introducido dos modelos avanzados de texto a voz (TTS) de Rime, Arcana v2 y Mist v2, en su plataforma, mejorando sus ofertas de IA Native Cloud. Estos modelos, según informó Together AI, tienen como objetivo proporcionar soluciones de voz de nivel empresarial con expresividad mejorada y precisión en la pronunciación.
Avances en Tecnología TTS
Arcana v2 y Mist v2 están diseñados para integrarse perfectamente con los modelos de lenguaje grandes (LLM) existentes y los sistemas de voz a texto (STT), permitiendo a los usuarios gestionar su infraestructura de tecnología de voz de manera más eficiente. Los modelos están alojados en la infraestructura de computación en la nube dedicada de Together AI, garantizando baja latencia y alta fiabilidad esenciales para aplicaciones empresariales.
Arcana v2: Expresividad Conversacional Mejorada
Arcana v2 está diseñado para la expresividad, ofreciendo más de 40 voces en múltiples idiomas y dialectos para atender diversos escenarios de servicio al cliente. Es particularmente efectivo en entornos que requieren habilidades conversacionales matizadas, como ventas y soporte, donde ha demostrado mejorar métricas como la conversión de ventas y las tasas de éxito de llamadas.
Mist v2: Precisión en la Pronunciación
Mist v2 se centra en la pronunciación determinista, esencial para aplicaciones de alto volumen donde la consistencia es crítica. Este modelo permite a los usuarios definir la pronunciación una vez, asegurando uniformidad en diferentes voces y plataformas. Tal precisión es crucial en sectores como la salud y las finanzas, donde la comunicación precisa es vital.
Impacto en Aplicaciones Empresariales
Ambos modelos ya están desplegados en diversas industrias, desde empresas Fortune 500 hasta startups. La capacidad de Arcana v2 para mejorar la interacción conversacional ha llevado a mejoras significativas en el compromiso del cliente. Mientras tanto, la fiabilidad de Mist v2 en el control de pronunciación respalda entornos de alto riesgo como el servicio al cliente y los sistemas de respuesta de voz interactiva (IVR).
Infraestructura y Cumplimiento Normativo
Together AI proporciona una infraestructura robusta que respalda estos modelos, con recursos GPU dedicados y cumplimiento con los estándares SOC 2 Type II y HIPAA. Esta configuración garantiza que las empresas puedan desplegar soluciones de voz que cumplan con requisitos regulatorios estrictos mientras mantienen alto rendimiento y tiempo de actividad.
Perspectivas Futuras
Con la integración de estos modelos, Together AI continúa avanzando su plataforma, ofreciendo un conjunto completo de soluciones de voz que satisfacen las diversas necesidades de las empresas. Este desarrollo marca un paso significativo adelante en la evolución de las tecnologías de voz impulsadas por IA, prometiendo interacciones más naturales y efectivas en sistemas automatizados.
Fuente de la imagen: Shutterstock
Fuente: https://blockchain.news/news/together-ai-integrates-rime-voice-models-enhanced-tts-solutions
