En la era de los grandes modelos, ¿hacia dónde soplará el viento de los altavoces inteligentes?

Fuente original: Laboratorio a base de silicio

Autor: Bai Jiajia

Fuente de la imagen: Generado por Unbounded AI

Los altavoces inteligentes que no han estado en guerra durante mucho tiempo han marcado el comienzo de una nueva historia debido a la última actualización del producto de Baidu.

El 17 de octubre, en el Congreso Mundial de Baidu 2023, Li Ying, el nuevo director general de Xiaodu Technology, apareció en la final, trayendo una nueva especie de ecología doméstica inteligente de Baidu "Add Home Machine". Desde el punto de vista de la forma del producto, Tim Home Machine puede considerarse como una combinación completa de "altavoz inteligente + tableta + modelo grande".

Esto significa que la comprensión de Baidu de los altavoces inteligentes ha llegado a un nivel superior.

En el pasado, los altavoces inteligentes se consideraban la entrada del usuario en la era del Internet de las cosas, y Xiaomi, Baidu y Ali desencadenaron una prolongada guerra de precios a su alrededor, desde los 500 a 600 yuanes iniciales por unidad, hasta menos de 100 yuanes. Al final, la espada Baidu tomó la delantera y ganó el primer lugar en este "Three Kingdoms Killing" a través de la forma de producto de "altavoz + pantalla".

Sin embargo, el ganador no marcó el comienzo del momento de la selección como se esperaba, y las perspectivas para los altavoces inteligentes han sido mixtas. **

Según datos de Luotu Technology, las ventas omnicanal de altavoces inteligentes domésticos en 2022 serán de solo 26,31 millones de unidades, lo que supone un descenso interanual del 28%. En el primer semestre de este año, la industria no marcó una mejora, y las estadísticas del mismo calibre fueron de 11,48 millones de unidades vendidas a través de todos los canales, un 19% menos que el año anterior; Las ventas correspondientes fueron de 3.370 millones de yuanes, una disminución interanual del 20%.

La razón es que la ecología del hogar inteligente aún no se ha formado, la interacción de voz está limitada por la escena, la aplicación del teléfono móvil está más en línea con los hábitos de consumo y otros factores. Uno de los más importantes es que el producto de altavoz inteligente no es suficiente, no solo no puede soportar la gran responsabilidad de asistente doméstico, sino que incluso hacer una historia de terror de "cantar en medio de la noche".

Hoy en día, el gran modelo que pretende "empoderar a miles de industrias" es amenazante, y parece ser una buena solución a la falta de fuerza del producto. El "ex capitán" de Xiaodu, Jing Kun, una vez planeó un discurso sobre "La era de los grandes modelos, Xiaodu remodela la vida inteligente", aunque luego renunció por razones personales, pero desde el discurso de su sucesor Li Ying, la tendencia de generosidad de combinar modelos grandes y los productos de hardware de Xiaodu no ha cambiado.

Esta vez, ¿pueden los altavoces inteligentes cumplir con las expectativas de las personas?

¿Por qué los altavoces inteligentes no se convirtieron en el nuevo portal de usuario como se esperaba? **

** En el hogar inteligente, los altavoces inteligentes son un nodo clave, y algunas personas incluso lo llaman el "campo de batalla para los soldados" en la cadena de productos. La razón por la que es tan importante se debe principalmente a dos aspectos: la interacción y la tecnología. **

**En primer lugar, en la forma de interacción. **

No hay muchas formas en que los humanos estén acostumbrados a transmitir y recibir señales al mundo exterior, principalmente a través de la vista, el movimiento y el sonido.

El modo de interacción de los aparatos eléctricos tradicionales se basa principalmente en que "el usuario da instrucciones en un panel de control fijo (como un mando a distancia) y el aparato da retroalimentación en el panel de visualización". Funciona de manera muy estable, pero las instrucciones son inflexibles, ineficientes y orientadas al portador.

Por el contrario, la interacción de voz resuelve bien estos problemas. Por ejemplo, configurar una alarma a través de Siri es mucho más rápido que configurar una alarma en su teléfono.

Los altavoces inteligentes son el soporte más simple para realizar este conjunto de procesos de interacción de voz.

Por otro lado, desde un punto de vista técnico, los altavoces inteligentes también juegan un papel en la conexión de la parte superior e inferior.

Si el altavoz inteligente basado en la interacción de voz puede satisfacer las necesidades de los usuarios, entonces la inteligencia de las máquinas de historias, espejos y otros productos se convertirá. Si no puede satisfacer las necesidades de los usuarios, los productos de gama más alta, como los robots incorporados y los robots de guía de compras, son solo castillos en el aire.

** El nombre del altavoz inteligente en sí mismo es confuso, en la era del hogar inteligente prevista por la gran fábrica, el altavoz inteligente es en realidad un terminal similar a un enrutador, excepto que el enrutador debe suministrar la red para cada aparato eléctrico y el altavoz inteligente debe distribuir instrucciones de usuario a cada electrodoméstico. Es por eso que se ve como un nuevo portal de usuario. **

Entonces, ¿por qué los altavoces inteligentes no se convirtieron en el nuevo portal de usuario como se esperaba?

** Como se mencionó anteriormente, la resistencia insuficiente del producto y la homogeneización grave son las razones principales. **

El término altavoz inteligente se divide en dos partes: "inteligente" y "altavoz", y el enfoque determina su posicionamiento.

Si el altavoz inteligente se considera el núcleo del hogar inteligente, su trabajo es en realidad comprender las instrucciones dadas por el usuario y proporcionar retroalimentación, y la función principal del altavoz es la retroalimentación de voz. Sin embargo, debido al bajo grado de inteligencia, la interacción de voz en realidad no es tan libre como se imagina, y aún debe lograrse a través de palabras clave.

Como resultado, los usuarios pierden rápidamente el interés después de intentar interactuar y desarrollan una comprensión del producto centrada en los "altavoces". Las primas inteligentes se desvanecen, y los altavoces inteligentes con efectos de sonido más bajos que los altavoces profesionales del mismo precio son naturalmente difíciles de aceptar por los consumidores.

** Además de la falta de resistencia del producto, el impacto de reducción de dimensionalidad de los teléfonos móviles en los altavoces inteligentes es otra razón importante. **

A diferencia de la ecología doméstica de las principales fábricas, las aplicaciones móviles pueden ser compatibles con varias marcas de productos para el hogar inteligente, lo que brinda a los usuarios más opciones.

Al mismo tiempo, aunque el rango de interacción de los altavoces inteligentes supera al del control remoto o el panel de control de pared, todavía tienen ciertas limitaciones de espacio geográfico.

En términos generales, la sala de estar es un área con una concentración relativamente densa de electrodomésticos, y los altavoces inteligentes generalmente se encuentran aquí. Cuando los usuarios se acuestan en el dormitorio porque la luz es demasiado brillante para dormir y quieren bajar el brillo o cerrar las cortinas, no pueden satisfacer las necesidades a través de la interacción con altavoces inteligentes. En este punto, la ventaja de portabilidad de los teléfonos móviles será particularmente prominente.

Por último, la ecología del hogar inteligente aún no ha tomado forma, por lo que los terminales inteligentes a menudo no son solo las necesidades de los usuarios.

Desde el boom de los altavoces inteligentes en 2017, solo han pasado 6 años, lo que es mucho más corto que el ciclo de actualización de muchos electrodomésticos. Por lo tanto, incluso si se compra un altavoz inteligente, el espacio que puede reproducir es relativamente limitado. El rendimiento de bajo costo ha llevado a los consumidores a alejarse de él.

En general, aunque se esperaba que los altavoces inteligentes fueran altos en el pasado, bajo la doble barrera de la tecnología y los hábitos de los usuarios, todavía no eran suficientes para reemplazar a los teléfonos móviles como una nueva entrada de usuario, por lo que rápidamente cayeron en un período de amortiguación después de un corto período de gloria.

Los datos muestran que en 2022, se venderán un total de alrededor de 26 millones de altavoces inteligentes en China, y las ventas de altavoces inteligentes principales no superarán los 10 millones.

**¿Cómo romper el altavoz inteligente? **

Como se mencionó anteriormente, debido a la insuficiente fuerza del producto, el prefijo principal "inteligente" de los altavoces inteligentes a menudo es ignorado por los consumidores y luego cae en la disputa de efectos de sonido de la categoría de altavoces.

Por lo tanto, volver a encarrilarlo con el "núcleo inteligente" se ha convertido en un obstáculo que los grandes fabricantes deben intentar cruzar. **

En el mundo de los negocios, "cambiar la sopa sin cambiar la medicina" es a veces una estrategia empresarial muy efectiva, especialmente propicia para romper el pensamiento habitual de los consumidores.

En lugar de tratar de cambiar los estereotipos de los consumidores sobre los altavoces inteligentes, es mejor introducir una especie nueva y más concisa, como "agregar una máquina doméstica".

En comparación con los altavoces inteligentes, la sensación intuitiva de las máquinas domésticas es más clara y es fácil de asociar con asistentes domésticos y amas de llaves inteligentes.

Pero todo tiene dos caras, y aunque los fabricantes pueden crear una impresión más intuitiva cambiando su nombre, los consumidores tendrán decisiones de compra más complejas ante las nuevas especies, como prestar atención a los cambios que puede traer a la vida, si es necesario, etc.

Para respaldar estas nuevas historias, la dirección futura de la industria puede divergir.

** Un tipo es como Xiaodu, que soporta el precio de venta superponiendo el valor del hardware. **

Desde la forma del producto, la primera impresión de la máquina doméstica Tian Tian es "altavoz inteligente + tableta". Esta forma no sorprende a primera vista, porque los altavoces inteligentes de Xiaodu siempre han seguido la ruta de los "altavoces inteligentes + pantallas", y esta vez no son más que actualizar la pantalla a una tableta.

Sin embargo, después de una cuidadosa consideración, se puede encontrar que dividir la pantalla incrustada en el altavoz en una tableta que pueda funcionar de forma independiente, lo que parece un paso simple, en realidad resuelve muchos de los problemas persistentes de los terminales inteligentes en el pasado. Por ejemplo, la ecología del hogar inteligente de las principales fábricas no es compatible, los altavoces inteligentes están limitados por el espacio en el que se encuentran y los usuarios no pueden dar instrucciones en cualquier momento y en ningún lugar.

Al mismo tiempo, aunque "añadir máquinas domésticas" es una especie nueva, las tabletas y los altavoces son electrodomésticos habituales en la vida cotidiana, y los consumidores tienen una referencia para la comparación horizontal a la hora de tomar decisiones.

** La otra categoría es "no se puede vencer o unir", transfiriendo terminales inteligentes a terminales de hardware móvil que ya tienen una base de usuarios, como los teléfonos móviles. **

Hoy en día, entre los fabricantes de teléfonos móviles, Huawei ha conectado modelos grandes a sistemas operativos de teléfonos móviles a través de la nube, tomando la delantera en la realización de modelos grandes en la máquina. Xiaomi está tratando de utilizar el hardware de los teléfonos móviles para soportar el funcionamiento de los modelos grandes, y ya hay 13B modelos funcionando en el teléfono móvil.

También se están desarrollando grandes modelos de fabricantes de teléfonos móviles como OPPO, VIVO y Apple.

Objetivamente hablando, a partir de los diversos productos de modelos grandes existentes, la funcionalidad está más allá de los altavoces inteligentes anteriores, y las dos rutas mencionadas anteriormente pueden brindar a los usuarios una mejor experiencia.

Según la introducción de Li Ying, la máquina familiar tiene la capacidad de tener una larga memoria y la sustitución de roles sobre la base de un diálogo y un chat más libres. El ejemplo que dio fue si el niño y la máquina de la casa dijeran: "Soy un cachorro". La oportunidad familiar responde "¿Eres de Woof?" basándose en la historia que los niños suelen utilizar para transmitir la caricatura "Wangwang Li Dagong". "

Además, funciones como la generación de memorandos, la planificación de viajes y arreglos, y el control del entorno en la casa también se pueden implementar en la máquina doméstica.

La clave para el éxito de los altavoces inteligentes es crear la "tercera interacción"

Desde la perspectiva de los atributos del producto, los teléfonos móviles y los altavoces inteligentes tienen el potencial de convertirse en el núcleo de los hogares inteligentes.

El teléfono es compatible con varios ecosistemas y tiene capacidades de control remoto, por lo que puede ajustar cada habitación a la atmósfera adecuada antes de regresar a casa.

Los altavoces inteligentes tienen una mayor seguridad y privacidad, y varios dispositivos pueden comunicarse entre sí a través de la tecnología LAN o Bluetooth para evitar la fuga de información.

Entonces, en la era de los grandes modelos, ¿los teléfonos móviles y los altavoces inteligentes serán relaciones mutuamente excluyentes entre usted y yo, o construirán conjuntamente una ecología? **

Caijing Wuji cree que construir un ecosistema juntos será la respuesta definitiva. **El motivo se esconde en un detalle en el Baidu World Congress 2023.

Li Ying presentó que la máquina familiar tiene una súper capacidad de compañerismo, específicamente "cuando lo miras, él también girará la cabeza para mirarte".

Esto significa que los altavoces inteligentes tienen un tercer método de interacción además de la interacción de voz y la interacción tradicional de "acción + visión" basada en el panel de operación.

Esta interacción se consigue esencialmente mediante la mejora de las funciones de los sensores y la capacidad de los grandes modelos multimodales.

Los sensores son bien conocidos, y los terminales inteligentes tienen nuevas formas de percibir el mundo.

La capacidad multimodal se refiere al hecho de que en el terminal inteligente, puede sintetizar los datos extraídos por múltiples sensores y combinar los resultados procesados para obtener la respuesta final.

Estas actualizaciones tecnológicas han traído cambios cualitativos a los terminales de fabricación inteligente.

En el pasado, los terminales inteligentes a menudo participaban en la vida del usuario como proveedores pasivos de servicios, y solo podían dar retroalimentación si el usuario daba instrucciones. La aparición del tercer modo de interacción hace posible que los terminales inteligentes participen activamente en la vida del usuario.

Por ejemplo, cuando los ancianos caen o entran en coma, pueden llamar automáticamente al hospital, avisar a sus hijos y dar consejos de vida y dietética según el trabajo y el descanso o el estado de salud del jefe del hogar

Hay dos razones principales por las que esto es evidencia de la ecología de la co-construcción.

** En primer lugar, el rango de detección del sensor es limitado. En términos simples, el núcleo inteligente debe ser capaz de "ver" el coma de los ancianos para poder funcionar. **

** En segundo lugar, la limitación del tamaño del teléfono móvil condena a que sea imposible llevar varios sensores como terminales inteligentes. **

Por supuesto, la misma función se puede lograr organizando adicionalmente los sensores y luego integrando los datos en el modelo grande del teléfono.

Sin embargo, la posición del asistente doméstico determina que el núcleo inteligente de toda la casa debe tener estabilidad y no puede verse afectado por la intensidad de la señal como el teléfono móvil.

Con la bendición de la "tercera interacción", el nicho ecológico de los altavoces inteligentes se ha mantenido más estable. Sin embargo, objetivamente hablando, la actual "tercera interacción" en toda la categoría de altavoces inteligentes aún está en pañales, y el gran modelo multimodal acaba de comenzar a abrir la cadena de percepción, toma de decisiones y retroalimentación. Estos escenarios permanecen en la imaginación. **

Si los altavoces inteligentes quieren realmente romper el juego, e incluso convertirse finalmente en los miembros de la familia a los que los consumidores están acostumbrados, los elementos técnicos son, por supuesto, clave, pero el más importante es la imaginación basada en la realidad, captar los puntos débiles del usuario en función de una determinada escena y hacer avances punto a punto. **

Las palabras del "ex capitán" de Xiaodu, Jing Kun, pueden ser la mejor anotación para los altavoces inteligentes en la actualidad, y también es la creencia que los practicantes deben defender más:

"Aunque a partir del torrente de la historia, es posible que nuestra generación no logre realmente la inteligencia artificial general (AGI). Pero si existe ese 1% de posibilidades de cambiar el mundo, queremos intentarlo. "

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)