banner

Dahua Technology staat op de eerste plaats in twee ReCTS-taken

2021-04-221196

Dahua Technology, een wereldwijd toonaangevende leverancier van video-centrische slimme IoT-oplossingen en -diensten, heeft met succes de topplaatsen van twee belangrijke taken in de recente Robust Reading Competition on Reading Chinese Texts on Signboard (ReCTS) bemachtigd, waarbij het de categorieën karakterherkenning en lijnherkenning domineerde.

Robust Reading is een onderzoeksgebied dat zich bezighoudt met de detectie en herkenning van tekstuele informatie in afbeeldingen onder niet-gecontroleerde omstandigheden. Sinds 2011 wordt de Robust Reading Competition georganiseerd met uitdagingen die een breed scala aan real life scenario's bestrijken. Elke uitdaging is opgezet rond verschillende taken. ReCTS is een van deze uitdagingen die typisch verbonden zijn aan de International Conference on Document Analysis and Recognition (ICDR).

De ReCTS dataset bevat 25.000 gelabelde afbeeldingen die onder ongecontroleerde omstandigheden door telefooncamera's zijn verzameld. Hij is vooral gericht op Chinese teksten op uithangborden van restaurants. De dataset is opgesplitst in een training set en een test set. De trainingsset bestaat uit 20.000 beelden, en de testset uit 5.000 beelden. Dit jaar heeft Dahua Technology twee belangrijke taken van ReCTS gedomineerd.

ReCTS Taak 1: Karakterherkenning in een uithangbord
(bron: rrc.cvc.uab.es / 24 maart 2021)

Taak 1 betreft tekenherkenning in een uithangbord. Het doel is om tekens te herkennen van een uitgesneden tekenbeeld. Als basislijn gebruikte het Dahua-team (DH_OCR) EfficientNet-reeksen die werden getraind met verschillende diepte en verschillende breedte. Synthetische monsters gegenereerd door Dahua's eigen algoritme werden ook gebruikt voor deze taak. Om de gegevens in evenwicht te brengen, werden de monsters verwerkt met de methoden "smooth", "cut" en "rotate". Het model zelf werd getraind met ReCTS-trainingsgegevens en synthetische gegevens. Voor deze taak behaalde het team een eindresultaat van 97,73%, waarmee ze bovenaan de lijst kwamen te staan.

ReCTS Taak 2: Tekstregelherkenning in een uithangbord
(bron: rrc.cvc.uab.es / 22 maart 2021)

Taak 2 behandelt tekstregelherkenning in een uithangbord. De bijgesneden tekstlijnbeelden en de coördinaten van de veelhoekige begrenzingen in de beelden worden ook gegeven in deze specifieke taak. De trainingsgegevens van het Dahua-team omvatten ReCTS, LSVT, RCTW, ART en enkele kunstmatige synthetische gegevens van hoge kwaliteit. CRNN framework werd gebruikt voor tekstherkenning, samen met verschillende structuren van multi-scale feature extraction backbone zoals SAResNET. Het team gebruikte ook multi-model fusie om het eindresultaat te voorspellen. Het resultaat was dat het Dahua-team de eerste plaats behaalde voor deze taak, met een totaalscore van 96,93%.

Automatische detectie en herkenning van teksten in natuurlijke scènes krijgt steeds meer aandacht vanwege het brede scala aan toepassingen. Het is ook een belangrijke vereiste voor verschillende op inhoud gebaseerde beeldanalysetaken. De ReCTS-erkenningen die Dahua onlangs ontving, zijn het resultaat van de jarenlange continue innovatie van het bedrijf op dit gebied en dienen als bewijs van zijn toewijding aan doorbraken op het gebied van AI-technologie. Met zijn missie "Een veiligere samenleving en slimmer leven mogelijk maken" zal Dahua Technology zich blijven concentreren op "Innovatie, Kwaliteit en Service" om zijn partners en klanten over de hele wereld.