マルチモーダルモデルとは
単一のデータ タイプ (テキストのみ、画像のみなど) の処理に限定されるユニモーダル モデルと比較して、マルチモーダル モデルは、テキスト、画像、ビデオなどの複数の異種データ種類を同時に処理し、深く統合できる高度なAIシステムです。
マルチモーダルモデルでは何ができる
Dahua Xinghan Mシリーズの大規模モデルのマルチモーダル機能に基づいて、画像と自然言語間の効率的なアライメントと協調的な理解を実現し、WizSeek(テキストから画像への検索)やテキスト定義アラーム機能などの多様なアプリケーションを強化します。
WizSeek
テキスト定義アラーム

WizSeekとは
Xinghanマルチモーダルモデルを搭載したWizSeekは、自然言語検索によってビデオ調査に革命をもたらします。
対象(人物、車両、動物、物品など)を説明するだけで、
WizSeekは録画されたビデオアーカイブから一致する映像を瞬時に検索します。
手作業による確認をインテリジェントで高精度な検索に置き換えることで、より迅速で直感的な結果を提供します。
主な利点
幅広く検索
人物、乗り物、動物、標識、植物など、400 以上のカテゴリをカバーします。 正確に検索
Dahua Xinghan大規模AIモデルに基づく高精度検索。 すぐに検索
キーワードまたはフレーズを入力すると、数秒以内に対象の結果が見つかります。 使いやすい
ユーザーフレンドリーな検索のようなインターフェースにより、ワンクリック アクセスとあいまい検索が可能になります。
テキスト定義アラームテキスト定義アラームとは
テキスト定義アラームは、ユーザーがテキスト記述を通じてカスタムアラートルールを定義できる機能です。プロンプトテキストに基づいた新しいアルゴリズムを開発することで、開発の障壁を大幅に低減し、従来の複雑なカスタマイズプロセス(数千ものアノテーション付きデータサンプルでCNNモデルをトレーニングし、デプロイする作業が必要だった)を簡素化します。ユーザーは、コーディングや複雑な手順を必要とせず、シンプルなテキストルールだけでカスタムアラートを瞬時に作成できます。
主な利点
- 01
技術的な障壁ゼロコーディングを必要とせず、単語だけでカスタム アルゴリズムを生成します。
コーディングを必要とせず、単語だけでカスタム アルゴリズムを生成します。 - 02
即時導入数秒以内にテキストの説明をリアルタイムのアラームに変換します。
数秒以内にテキストの説明をリアルタイムのアラームに変換します。 - 03
低コスト運用高価なデータ収集とモデルトレーニングのコストを大幅に削減します。
高価なデータ収集とモデルトレーニングのコストを大幅に削減します。 - 04
マルチシナリオ適応性シンプルなテキスト入力でさまざまなシナリオに適応します。
シンプルなテキスト入力でさまざまなシナリオに適応します。
テキスト定義アラームを最適化する方法
自己学習アルゴリズムにより、同じ IVSS 上でデバイス上のトレーニングと最適化が実行され、使用のたびにアルゴリズムがよりスマートかつ正確になります。
製品
IVSS

IVSS51-I Series / IVSS71-Iシリーズ
詳しく見る