19 septembre 2025 | Dahua Technology, l'un des principaux fournisseurs mondiaux de solutions et de services AIoT centrés sur la vidéo, a officiellement lancé ses modèles d'IA à grande échelle Xinghan, un système d'IA de nouvelle génération de niveau industriel qui intègre une intelligence visuelle à grande échelle avec des capacités multimodales et linguistiques. Développé pour relever les défis complexes des environnements réels, Xinghan représente une avancée majeure dans l'innovation continue de Dahua, favorisant la transformation intelligente dans divers secteurs.

Fondements technologiques de Xinghan
Avec pour mission de permettre aux machines de véritablement comprendre le monde, le système de modèles Xinghan continue d'évoluer en faisant le lien entre la recherche de pointe et les applications concrètes. Depuis le lancement de ses recherches sur l'attention visuelle en 2017 et la redéfinition de l'IA dans le domaine de la sécurité avec le lancement de son modèle de base de cognition visuelle en 2023, Dahua a démontré son leadership technologique continu en matière d'innovation AIoT.
Nommé d'après le mot chinois signifiant « galaxie », le système Xinghan récemment mis à niveau offre une matrice de capacités complète alimentée par la synergie entre le cloud et la périphérie, permettant une intelligence évolutive et adaptative dans tous les secteurs. Poussé par l'analyse visuelle et les demandes spécifiques à l'industrie, Xinghan intègre l'intelligence multimodale à une expertise approfondie du domaine. Ce développement a donné naissance à trois séries principales : les modèles L, V et M. Le modèle L se concentre sur la compréhension et l'interaction du langage naturel, tandis que les deux autres modèles s'adressent à des applications plus spécifiques :
Série V : modèles Xinghan Vision
Axée sur l'intelligence visuelle avancée et l'analyse vidéo, cette série rationalise les catégories cibles en se concentrant sur les cibles clés (par exemple, les humains, les véhicules à moteur et les véhicules non motorisés) afin de réduire la complexité du modèle tout en conservant une grande précision. Ses principales caractéristiques sont les suivantes :
- Protection périmétrique : la couverture et la portée de la détection périmétrique sont étendues grâce à l'identification précise de cibles plus petites (jusqu'à 20 × 20 pixels) par rapport aux modèles d'IA traditionnels basés sur le CNN, ce qui réduit les fausses alarmes et augmente la portée de détection des caméras de grande taille.
- WizTracking: il offre un algorithme de suivi intelligent de nouvelle génération capable de gérer les occlusions complexes et les variations de posture des cibles, ce qui permet d'améliorer la précision de 50 %.
- Crowd Map: il offre un algorithme de suivi intelligent de nouvelle génération capable de gérer les occlusions complexes et les variations de posture des cibles, ce qui permet d'améliorer la précision de 50 %.
- Adaptation à la scène – AI WDR: cette fonctionnalité exploite la connaissance de la situation pour analyser les caractéristiques spatiales et contextuelles d'une scène, permettant ainsi une configuration intelligente et automatisée de la caméra.
Assistance aux règles IA
- Assistance aux règles IA : elle est conçue pour la délimitation automatique des règles d'intrusion de la protection périmétrique, offrant un accès en un clic, une reconnaissance de scène très précise, une analyse automatique, et plus encore.
Série M : modèles multimodaux Xinghan
Les modèles multimodaux sont des systèmes d'IA avancés capables de traiter simultanément et d'intégrer en profondeur plusieurs types de données hétérogènes (par exemple, du texte, des images, de l'audio et de la vidéo). Leur principale capacité réside dans l'exploitation de techniques avancées d'alignement des représentations intermodales et de compréhension sémantique conjointe afin de combler les écarts entre les modalités, ce qui permet d'obtenir une corrélation sémantique profonde et une compréhension collaborative entre diverses sources de données. Cette capacité améliore non seulement considérablement l'efficacité et la richesse du traitement de l'information, mais permet également une interaction homme-machine plus naturelle et ouvre la voie à un éventail plus large de scénarios d'application. Ses caractéristiques notables comprennent :
- WizSeek: cette fonctionnalité révolutionne l'investigation vidéo grâce à la recherche en langage naturel. Il suffit de décrire votre cible (par exemple, une personne, un véhicule, un animal ou un objet, etc.) et WizSeek récupère instantanément les séquences correspondantes dans les archives vidéo enregistrées. Elle offre une méthode de recherche de cible étendue, instantanée, conviviale et précise.
Alarmes définies par texte
-
Alarmes définies par texte: cette fonctionnalité permet de créer des règles d'alarme personnalisées par simple saisie de texte, sans codage, développement manuel ou processus coûteux et fastidieux. Elle permet aux utilisateurs de définir des alarmes en les décrivant simplement en langage naturel, ce qui réduit considérablement le seuil de développement et permet une configuration rapide, flexible et évolutive, adaptée à divers scénarios réels.
Perspectives d'avenir : construire l'avenir de l'AIoT intelligent
À l'avenir, Dahua continuera à améliorer les modèles d'IA à grande échelle Xinghan afin de répondre à la demande croissante en matière de transformation intelligente. En collaborant étroitement avec ses partenaires de l'écosystème et ses clients du monde entier, Dahua vise à étendre l'application des grands modèles à des scénarios réels, favorisant ainsi une nouvelle dynamique dans les domaines de la sécurité publique numérique, des transports intelligents, de la gestion de l'énergie et de l'innovation au niveau des entreprises.
Pour plus d'informations sur les modèles à grande échelle Xinghan, veuillez contacter votre représentant Dahua local ou consulter la page web officielle ici.
*Les résultats sont basés sur une configuration standard et un environnement de test.









