¿Qué son los modelos multimodales?
En comparación con los modelos unimodales, que se limitan a procesar un único tipo de dato (por ejemplo, solo texto o solo imagen), los modelos multimodales son sistemas de IA avanzados capaces de procesar e integrar de manera profunda y simultánea múltiples tipos de datos heterogéneos, como texto, imagen y vídeo.
¿Qué pueden hacer los modelos multimodales?
Basado en las capacidades multimodales del modelo grande Dahua Xinghan serie M, logra una alineación eficiente y una comprensión colaborativa entre imágenes y lenguaje natural, lo que potencia diversas aplicaciones como WizSeek (búsqueda de texto a imagen) y las funciones de alarmas definidas por texto.
WizSeek
Alarmas definidas por texto

¿Qué es WizSeek?
Impulsado por los Modelos Multimodales Xinghan, WizSeek revoluciona la investigación de vídeo mediante búsqueda en lenguaje natural. Basta con describir el objetivo (persona, vehículo, animal, objeto, etc.) y WizSeek recupera al instante las grabaciones coincidentes en los archivos de vídeos registrados. Al sustituir la revisión manual por una búsqueda inteligente y de alta precisión, ofrece resultados más rápidos e intuitivos.
Beneficios clave
Buscar ampliamente
Cubre más de 400 categorías, desde personas, vehículos y animales hasta señales, plantas y más allá. Buscar con precisión
Búsqueda de alta precisión basada en los Modelos de IA a gran escala Dahua Xinghan. Buscar al instante
Introduce una palabra clave o frase para encontrar resultados objetivos en cuestión de segundos. Buscar de forma amigable
Interfaz fácil de usar, similar a un buscador, que ofrece acceso con un solo clic y búsqueda difusa.
Alarmas definidas por texto¿Qué son alarmas definidas por texto?
Las alarmas definidas por texto permiten a los usuarios establecer reglas de alerta personalizadas mediante descripciones en lenguaje natural. Al desarrollar nuevos algoritmos basados en indicaciones de texto, se reduce significativamente la barrera de desarrollo y se sustituyen los complejos procesos de personalización tradicionales —que requerían entrenar modelos CNN con miles de muestras de datos anotados y su posterior despliegue—. Los usuarios pueden crear de forma instantánea alertas personalizadas utilizando simples reglas de texto, sin necesidad de programación ni procedimientos complicados.
Beneficios clave
- 01
Cero barreras técnicasGenere algoritmos personalizados solo con palabras, sin necesidad de programar.
Genere algoritmos personalizados solo con palabras, sin necesidad de programar. - 02
Despliegue instantáneoTransforme descripciones de texto en alarmas en tiempo real en cuestión de segundos.
Transforme descripciones de texto en alarmas en tiempo real en cuestión de segundos. - 03
Operación de bajo costoReduzca drásticamente los costos de recopilación de datos y entrenamiento de modelos.
Reduzca drásticamente los costos de recopilación de datos y entrenamiento de modelos. - 04
Adaptabilidad a múltiples escenariosAdáptese a diversos escenarios con simples entradas de texto.
Adáptese a diversos escenarios con simples entradas de texto.
¿Cómo optimizar las alarmas definidas por texto?
Mediante un algoritmo de autoaprendizaje que realiza entrenamiento y optimización en el propio dispositivo IVSS, lo que permite que los algoritmos se vuelvan más inteligentes y precisos con cada uso.
Productos
IVSS

Serie IVSS51-I / IVSS71-I
Ver más