マルチモーダルモデルとは

単一のデータ タイプ (テキストのみ、画像のみなど) の処理に限定されるユニモーダル モデルと比較して、マルチモーダル モデルは、テキスト、画像、ビデオなどの複数の異種データ種類を同時に処理し、深く統合できる高度なAIシステムです。

マルチモーダルモデルでは何ができる

Dahua Xinghan Mシリーズの大規模モデルのマルチモーダル機能に基づいて、画像と自然言語間の効率的なアライメントと協調的な理解を実現し、WizSeek(テキストから画像への検索)やテキスト定義アラーム機能などの多様なアプリケーションを強化します。
WizSeek
テキスト定義アラーム

WizSeekとは

Xinghanマルチモーダルモデルを搭載したWizSeekは、自然言語検索によってビデオ調査に革命をもたらします。 対象(人物、車両、動物、物品など)を説明するだけで、 WizSeekは録画されたビデオアーカイブから一致する映像を瞬時に検索します。 手作業による確認をインテリジェントで高精度な検索に置き換えることで、より迅速で直感的な結果を提供します。

主な利点

テキスト定義アラームとは

テキスト定義アラームは、ユーザーがテキスト記述を通じてカスタムアラートルールを定義できる機能です。プロンプトテキストに基づいた新しいアルゴリズムを開発することで、開発の障壁を大幅に低減し、従来の複雑なカスタマイズプロセス(数千ものアノテーション付きデータサンプルでCNNモデルをトレーニングし、デプロイする作業が必要だった)を簡素化します。ユーザーは、コーディングや複雑な手順を必要とせず、シンプルなテキストルールだけでカスタムアラートを瞬時に作成できます。

主な利点

テキスト定義アラームを最適化する方法

自己学習アルゴリズムにより、同じ IVSS 上でデバイス上のトレーニングと最適化が実行され、使用のたびにアルゴリズムがよりスマートかつ正確になります。

製品

NVR

NVR5-XI / Proシリーズ

Coming soon

IVSS

IVSS51-I Series / IVSS71-Iシリーズ

詳しく見る

IVD

IVD5148-Iシリーズ

詳しく見る