Die Spracherkennungstechnologie der russischen MDG-Gruppe gilt als die beste der Welt
Sie haben keine Berechtigung Anhänge anzusehen. Anhänge sind ausgeblendet.
Die von der MDG-Unternehmensgruppe (Teil des Sberbank-Ökosystems) entwickelte Technologie zur Diarisierung und Spracherkennung wurde bei der internationalen CHiME-Herausforderung zur Sprachtrennung und -erkennung (CHiME-6) als die beste anerkannt. Die Technologie wurde für die Erkennung der englischen Sprache von mehreren Mikrofonen in einer natürlichen Umgebung hoch anerkannt. Die MDG-Gruppe zeigte die besten Testergebnisse bei der schwierigsten Aufgabe des Wettbewerbs und übertraf die Wettbewerber deutlich.
Die Organisatoren von CHiME bieten den stärksten Teams aus der ganzen Welt verschiedene Aufgaben an, die mit jedem neuen Wettbewerb kompliziert werden. Bei CHiME-5 lösten die Teilnehmer das sogenannte Cocktailparty-Problem - das Erkennen der spontanen Sprache mehrerer Sprecher unter Bedingungen einer teilweisen Überlappung von Sprache und Lärm, dh in einer typischen Kommunikationssituation auf einer Party. Dieser Block erforderte die Arbeit mit segmentierter (bereits hervorgehobener) Sprache. Die Neuheit und Besonderheit von CHiME-6 war, dass die Teilnehmer zum ersten Mal in der Geschichte gebeten wurden, ein ähnliches Problem zu lösen, jedoch mit nicht segmentierter Sprache mit einer Sprachüberlappung von bis zu 20% zu arbeiten. Das MDG-Team konzentrierte sich auf die Lösung dieser schwierigsten Aufgabe.
Die Beiträge für den Wettbewerb wurden bei 20 Abendessen in echten Häusern auf Partys eingereicht, auf denen Menschen kochten, aßen, Geschirr spülten, frei und emotional kommunizierten, scherzten und lachten. Zur Erkennung ist es schwierig, gleichzeitig 2-4 Personen zu sprechen, Nachhall und intensives Geräusch - das Klingeln von Geräten, das Gießen von Wasser aus dem Wasserhahn, das Summen der Klimaanlage, Schritte, Lachen. Ziel der Teilnehmer ist es, ein Erkennungssystem zu schaffen, das die Aufzeichnungen „abhört“ und eine vollständige Entschlüsselung mit möglichst wenig Fehlern erzeugt. Das MDG-Team belegte den ersten Platz:
Sie haben keine Berechtigung Anhänge anzusehen. Anhänge sind ausgeblendet.
Zu diesem Zweck wurde ein einzigartiger Algorithmus zur Unterscheidung von Sprachsegmenten für jeden Sprecher entwickelt und ein Komplex aus mehreren neuronalen Netzen unterschiedlicher Architekturen erstellt, der verschiedene Sprecher unterscheidet, Bimforming implementiert (der Effekt, Mikrofone auf einen bestimmten Sprecher auszurichten) und Sprache direkt erkennt. An dem Wettbewerb nahmen neben den MDGs auch wissenschaftliche Teams aus der ganzen Welt teil: bekannte IT-Unternehmen - Toshiba und mehrere andere - sowie führende Universitätsführer auf dem Gebiet der Sprachtechnologien: Johns Hopkins University (USA), Universität für Wissenschaft und Technologie in China, Technische Universität Brno (Tschechische Republik) und andere.
„Die MDGs-Gruppe entwickelt, entwickelt und verbessert seit 30 Jahren Sprachtechnologien. In diesem Jahr stand CHiME-6 zum ersten Mal in der Geschichte vor der schwierigsten Aufgabe - der Arbeit mit nicht segmentierter Sprache. Die qualitativ hochwertige Spracherkennung verschiedener Sprecher, die durch Lärm unterbrochen wird, ermöglicht es uns, Dienste aus der Kategorie der innovativen für den täglichen Gebrauch zu entfernen, unser Geschäft zu verbessern und unser Leben zu vereinfachen. Eine qualitativ hochwertige Verarbeitung von nicht segmentierter Sprache ermöglicht beispielsweise die kompetente Aufzeichnung von Besprechungen, bei denen mehrere Sprecher gleichzeitig sprechen, und eine intelligente Sprachanalyse automatisiert die Arbeit von Contact Centern: Erkennen spontaner Sprache, Klassifizieren von Sprachanrufen, Identifizieren der Einhaltung des Skripts, Ziehen von Schlussfolgerungen zur Kundenzufriedenheit und als Dialog, Das bedeutet - die Arbeit moderner Contact Center für Einzelhandel, E-Commerce und Telekommunikation erheblich optimieren. Die Anerkennung der MDGs in diesem internationalen Wettbewerb ist nicht nur unser persönlicher Sieg, sondern ein bedeutendes Ereignis für die gesamte Branche. Wir freuen uns, die Lösung von Problemen im Bereich der Spracherkennung, an denen die stärksten Teams aus der ganzen Welt arbeiten, auf ein neues Niveau zu bringen und ihre Schlüsselkompetenzen angemessen zu präsentieren auf dem Weltmarkt “, kommentiert Dmitry Dyrmovsky, Generaldirektor der MDG-Unternehmensgruppe.
„Die Aufgabe von CHiME ist es, den Erfahrungsaustausch der stärksten Teams aus der ganzen Welt sicherzustellen und die Lösung globaler Probleme im Bereich der Spracherkennung voranzutreiben. Und wir begrüßen die Leistungen der MDG-Unternehmensgruppe in diesem Bereich “, sagte John Barker, ein Vertreter der University of Sheffield (UK), Mitglied des Organisationskomitees der CHiME Challenge.
Die MDG-Unternehmensgruppe (Teil des Sberbank-Ökosystems) ist ein globaler Entwickler intelligenter Sprachtechnologien, Gesichtserkennung und Technologieexperte auf dem Gebiet der künstlichen Intelligenz und des maschinellen Lernens. Eines der wenigen Unternehmen auf der Welt, das beide biometrischen Modalitäten entwickelt und entwickelt: Gesicht und Stimme. Die Technologie zur Identifizierung von Sprachfälschungen und Spracherkennung der MDG-Gruppe nimmt eine führende Position in den Weltbewertungen von NIST, ASVspoof Challenge, VOiCES und CHiME Challenge ein. MDG-Lösungen sind
in 70 Ländern gefragt.
РоÑÑийÑÐºÐ°Ñ ÑеÑÐ½Ð¾Ð»Ð¾Ð³Ð¸Ñ ÑаÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ñ ÑеÑи гÑÑÐ¿Ð¿Ñ ÐºÐ¾Ð¼Ð¿Ð°Ð½Ð¸Ð¹ ЦРТ пÑизнана лÑÑÑей в миÑе
www.speechpro.ru