멀티모달 모델이란?
유니모달(텍스트만, 이미지만 등) 처리에 한정된 모델과 달리, 멀티모달 모델은 텍스트·이미지·영상 등 이질적 데이터 유형을 동시에 처리하고 깊이 있게 융합하는 고도화된 AI 시스템입니다.
멀티모달 모델로 무엇을 할 수 있나?
다후아 Xinghan M-시리즈 대규모 모델의 멀티모달 역량을 기반으로, 이미지와 자연어 간 정합을 효율적으로 수행하고 협업적 이해를 구현합니다. 이를 통해 WizSeek(텍스트 기반 이미지·영상 검색)과 텍스트 정의 알람 등 다양한 애플리케이션을 지원합니다.
WizSeek
텍스트 기반 알람

WizSeek란?
Xinghan 멀티모달 모델을 기반으로 하는 WizSeek은 자연어 검색으로 영상 수색 방식을 혁신합니다. 사람, 차량, 동물, 사물 등 목표를 텍스트로 설명하면, 녹화 영상 아카이브 전반에서 해당 장면을 즉시 찾아줍니다. 수작업 검토를 고정밀 지능형 검색으로 대체해 더 빠르고 직관적인 결과를 제공합니다.
핵심 장점
광범위 검색
사람, 차량, 동물부터 표지판, 식물 등까지 400종 이상 카테고리 지원 정밀 검색
Xinghan 대규모 AI 모델 기반의 고정밀 검색 즉시 검색
키워드나 문구 입력만으로 수초 내 목표 결과 탐색 쉬운 사용성
검색형 인터페이스 제공, 퍼지 검색 지원으로 원클릭 접근
텍스트 기반 알람텍스트 기반 알람이란?
텍스트 기반 알람은 사용자가 텍스트 설명만으로 맞춤 알람 규칙을 정의할 수 있게 해줍니다. 프롬프트 텍스트를 바탕으로 신규 알고리즘을 생성하여, 수천 건의 라벨링 데이터로 CNN 모델을 학습·배포하던 전통적이고 복잡한 맞춤 개발 과정을 대체하며 개발 장벽을 크게 낮춥니다. 코딩이나 복잡한 절차 없이 간단한 텍스트 규칙만으로 즉시 사용자 맞춤 알람을 생성할 수 있습니다.
핵심 장점
- 01
기술 장벽 없음텍스트만으로 맞춤 알고리즘 생성, 코딩 불필요
텍스트만으로 맞춤 알고리즘 생성, 코딩 불필요 - 02
즉시 배포텍스트 설명을 실시간 알람으로 수초 내 전환
- 03
저비용 운영데이터 수집 및 모델 학습 비용 대폭 절감
- 04
다양한 시나리오 적응간단한 텍스트 입력만으로 다양한 현장 시나리오에 유연 대응
간단한 텍스트 입력만으로 다양한 현장 시나리오에 유연 대응
텍스트 기반 알람 최적화
자기학습 알고리즘으로 동일 장비 내 학습과 최적화를 수행하여, 사용할수록 알고리즘이 더 지능적이고 정확해지도록 합니다.
제품
NVR

NVR5-XI / Pro Series
출시예정IVSS

IVSS51-I Series / IVSS71-I Series
더보기IVD

IVD5148-I Series
더보기