

เบื้องหลังความสำเร็จทางเทคโนโลยีของ Xinghan
ด้วยภารกิจที่มุ่งมั่นจะทำให้เครื่องจักร "เข้าใจโลก" ได้อย่างแท้จริง ระบบโมเดล Xinghan ได้เชื่อมโยงงานวิจัยที่ล้ำสมัยเข้ากับการใช้งานจริงอย่างต่อเนื่อง นับตั้งแต่การริเริ่มวิจัยด้าน Visual Attention ในปี 2560 และการสร้างนิยามใหม่ให้ AI ในวงการความปลอดภัยด้วยการเปิดตัวโมเดลพื้นฐานด้านการรับรู้ทางภาพในปี 2566 ต้าหัวได้แสดงให้เห็นถึงความเป็นผู้นำด้านนวัตกรรม AIoT มาโดยตลอด
ระบบ Xinghan ที่อัปเกรดใหม่นี้ มีชื่อมาจากคำในภาษาจีนที่แปลว่า "กาแล็กซี" นำเสนอชุดความสามารถแบบครบวงจรที่ทำงานสอดประสานกันระหว่าง Edge และ Cloud ทำให้เกิดระบบอัจฉริยะที่ยืดหยุ่นและปรับเปลี่ยนได้ตามการใช้งาน โมเดล Xinghan ขับเคลื่อนด้วยการวิเคราะห์เชิงภาพและความต้องการของแต่ละอุตสาหกรรม โดยผสานความอัจฉริยะหลายรูปแบบเข้ากับความเชี่ยวชาญเฉพาะทาง จนเกิดเป็นโมเดล 3 ซีรีส์หลัก ได้แก่ L, V และ M
V-Series: Xinghan Vision Models
ซีรีส์นี้เน้นความสามารถด้านการวิเคราะห์ภาพและวิดีโอขั้นสูง โดยมุ่งไปที่เป้าหมายหลัก (เช่น คน, ยานยนต์ และยานพาหนะอื่นๆ) เพื่อลดความซับซ้อนของโมเดล แต่ยังคงความแม่นยำไว้สูงสุด ฟีเจอร์เด่นได้แก่:

- Perimeter Protection (การป้องกันขอบเขต): มีระยะการตรวจจับที่ไกลและครอบคลุมยิ่งขึ้น เพราะสามารถระบุเป้าหมายขนาดเล็ก (แม้เล็กถึง 20x20 พิกเซล) ได้ดีกว่าโมเดล AI แบบเดิมๆ ช่วยลดการแจ้งเตือนที่ผิดพลาดได้อย่างมาก*
- WizTracking: อัลกอริทึมติดตามเป้าหมายยุคใหม่ ที่สามารถรับมือกับสถานการณ์ที่เป้าหมายถูกบดบังหรือมีการเปลี่ยนท่าทางที่ซับซ้อนได้ พร้อมความแม่นยำที่สูงขึ้นถึง 50%*
- Crowd Map (แผนที่ฝูงชน): ตรวจจับเป้าหมายขนาดเล็กในระยะไกลได้ดียิ่งขึ้นอย่างเห็นได้ชัด (ไกลขึ้น 2 เท่า) พร้อมเทคโนโลยีชดเชยภาพรวม (Umbrella Compensation) ที่ช่วยเพิ่มความแม่นยำขณะฝนตกได้ถึง 80%* นอกจากนี้ยังวิเคราะห์ได้ในระยะที่ไกลขึ้น 2.5 เท่า รองรับคนได้สูงสุด 5,000 คน และทำงานได้ดีเยี่ยมแม้ในที่แสงน้อยหรือมีผู้คนหนาแน่น*
- Scene Adaptive – AI WDR (การปรับภาพตามฉาก): ระบบจะวิเคราะห์สภาพแวดล้อมและบริบทของฉาก เพื่อปรับตั้งค่ากล้องโดยอัตโนมัติอย่างชาญฉลาด
- AI Rule Assist (ผู้ช่วยตั้งค่ากฎ AI): ช่วยกำหนดกฎการบุกรุกสำหรับระบบป้องกันขอบเขตให้อัตโนมัติ แค่คลิกเดียวก็ตั้งค่าได้อย่างแม่นยำ
M-Series: Xinghan Multimodal Models
โมเดลประเภทนี้คือระบบ AI ขั้นสูงที่สามารถประมวลผลและผสานข้อมูลต่างชนิดกัน (เช่น ข้อความ, รูปภาพ, เสียง, วิดีโอ) ได้พร้อมกันในเชิงลึก หัวใจหลักคือการใช้เทคนิคขั้นสูงเพื่อเชื่อมโยงและทำความเข้าใจความหมายที่สัมพันธ์กันระหว่างข้อมูลต่างรูปแบบ ทำให้การประมวลผลข้อมูลมีประสิทธิภาพและสมบูรณ์ขึ้นอย่างมาก การโต้ตอบระหว่างคนกับคอมพิวเตอร์จึงเป็นธรรมชาติยิ่งขึ้น และนำไปสู่การใช้งานในรูปแบบใหม่ๆ ได้อย่างไม่จำกัด ฟีเจอร์เด่นได้แก่:
- WizSeek: พลิกโฉมการค้นหาในวิดีโอด้วยการใช้ภาษาพูดทั่วไป เพียงแค่อธิบายสิ่งที่ต้องการค้นหา (เช่น คน, รถ, สัตว์ หรือสิ่งของ) WizSeek ก็จะค้นหาฟุตเทจที่ตรงกันจากวิดีโอที่บันทึกไว้ให้ทันที เป็นวิธีการค้นหาที่ครอบคลุม, รวดเร็ว, ใช้งานง่าย และแม่นยำ
- Text-Defined Alarms (การแจ้งเตือนด้วยข้อความ): สร้างกฎการแจ้งเตือนได้ง่ายๆ ผ่านการพิมพ์ข้อความ โดยไม่ต้องเขียนโค้ดหรือผ่านกระบวนการที่ยุ่งยากและใช้เวลานาน ผู้ใช้สามารถกำหนดการแจ้งเตือนได้เพียงแค่อธิบายสิ่งที่ต้องการ ซึ่งช่วยลดข้อจำกัดด้านเทคนิคในการพัฒนาลงอย่างมาก และทำให้การตั้งค่ามีความรวดเร็ว, ยืดหยุ่น และปรับเปลี่ยนได้ตามทุกสถานการณ์
ก้าวสู่อนาคตแห่ง AIoT อัจฉริยะ
ต้าหัวจะยังคงมุ่งมั่นพัฒนาโมเดล AI ขนาดใหญ่ "Xinghan" ต่อไป เพื่อตอบสนองความต้องการที่เพิ่มขึ้นของการเปลี่ยนแปลงสู่ความเป็นอัจฉริยะ ด้วยการทำงานอย่างใกล้ชิดกับพันธมิตรและลูกค้าทั่วโลก ต้าหัวตั้งเป้าที่จะขยายการนำโมเดลขนาดใหญ่ไปประยุกต์ใช้ในสถานการณ์จริงให้กว้างขวางขึ้น เพื่อสร้างแรงผลักดันใหม่ๆ ทั้งในด้านความปลอดภัยสาธารณะ, การคมนาคมอัจฉริยะ, การจัดการพลังงาน และนวัตกรรมระดับองค์กร
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโมเดล "Xinghan" โปรดติดต่อตัวแทนต้าหัวในพื้นที่ของท่าน หรือเยี่ยมชมเว็บไซต์อย่างเป็นทางการได้ ที่นี่.
*ผลลัพธ์อ้างอิงจากการตั้งค่าและสภาพแวดล้อมในการทดสอบที่เป็นมาตรฐาน