Wie Spracherkennung im Geschäftsleben eingesetzt wird

    Bild

    Auf dem Anrufverfolgungsmarkt reift eine Revolution: Wir stehen kurz vor der Einführung der Spracherkennungstechnologie. Vor kurzem fand es Anwendung in amerikanischen Diensten, wie schnell der Trend nach Russland kommen wird, welche Vorteile Unternehmer erhalten werden, sagt Jewgeni Wlassow, CEO von Calltouch.

    Hintergrund

    Zuerst schauen, was ist die Spracherkennung. In der wissenschaftlichen Gemeinschaft wird der Prozess der Umwandlung eines Sprachsignals in digitale Informationen (z. B. Textdaten) so genannt. Das Gegenteil von Technologie sind sprechende Roboter, die digitale Informationen in ein Sprachsignal umwandeln.

    Das erste Spracherkennungsgerät erschien 1952, es verstand die von einer Person gesprochenen Zahlen. Anfang der neunziger Jahre wurden Programme veröffentlicht, mit denen Menschen mit Behinderungen mit Text arbeiten konnten. Die Technologie wurde jedoch nicht weit verbreitet, da die Erkennung aufgrund mehrerer Probleme ungenau war:

    • beliebiger, naiver Benutzer;
    • spontane Sprache, begleitet von Agramatismen und „Sprachmüll“;
    • akustisches Rauschen und Verzerrung;
    • Sprachstörungen.


    Bild

    Darüber hinaus kann dasselbe Wort anders klingen, wenn eine Person mit einem Akzent spricht, die Betonung falsch setzt, das Tempo und die Lautstärke der Sprache ändert. Manchmal wirken sich diese Details auf das Verständnis zwischen Menschen aus, ganz zu schweigen von Computern.

    Allmählich lernten die Programme jedoch, die Stimme zu erkennen, und die erste Sprache, die sie verstanden, war Englisch: Sie ist weit verbreitet, einfach genug (einfacher als Russisch und Chinesisch) und erfordert daher weniger komplexe mathematische Algorithmen. Der Markt für westliche IT-Technologien ist schnell gewachsen und dank des starken Wettbewerbs wurde die Spracherkennung bald in der Wirtschaft weit verbreitet.

    Konversationsgeschäft

    In Russland hat bisher nur Yandex den größten Erfolg erzielt: 2013 führte das Unternehmen die SpeechKitCloud-Cloud-Technologie ein, mit deren Hilfe Sprache synthetisiert und erkannt werden kann.

    Die Synthese erfolgt durch einen statistischen Ansatz in der akustischen Modellierung. Einfach ausgedrückt, bildet das Programm eine neue Stimme, die auf den Intonationen lebender Menschen basiert. Dies ermöglicht es Ihnen, künstlicher Sprache eine emotionale Färbung zu verleihen (freundlich, böse, neutral) oder sexuelle Eigenschaften zu verleihen (Mann, Frau). Zum Zeitpunkt des Schreibens bot der Service einen Monat lang kostenlose Tests an, mit weiteren geschätzten Kosten von 5 USD pro 1000 Anfragen.

    Leider haben große Unternehmen es nicht eilig, diese Technologie in vollem Umfang zu nutzen, aber es gibt immer noch Enthusiasten. Oktell, ein russischer Entwickler von Call-Center-Automatisierungssystemen, verwendet beispielsweise SpeechKitCloud, um Begrüßungen und Sprachmenüs zu erstellen, die Anrufer hören, und um Antworten auf häufig gestellte Fragen aufzuzeichnen. Die Technologie wird gleichzeitig mit der Arbeit des Call Centers angewendet, wodurch die Betreiber weniger belastet werden.

    Kollegen von Repka.UA haben es fast geschafft, Menschen durch Autos zu ersetzen. Sie verbanden den SpeechKitCloud-Sprachsynthesizer und das Online-Shop-Buchhaltungssystem, entwickelten ein Auftragsbestätigungsskript. Als Ergebnis erschien Christina, die automatisch die Verfügbarkeit des Produkts und seinen Preis bei Eingang der Bestellung überprüft, das Versanddatum berechnet und den Kunden zur Bestätigung anruft.

    Bild

    Wenn eine Person Fragen hat, wird der Anruf an den Callcenter-Betreiber weitergeleitet. Natürlich war die Spracherkennungsrate von Christina zunächst niedrig. In ungewöhnlichen Situationen konnte sie eine Person nicht ersetzen und war während der Spitzenzeiten eingehender Anrufe mit der Arbeit verbunden.

    Bild

    Dank der Erstellung eines eigenen Sprachmodells gelang es dem Unternehmen jedoch, die Genauigkeit zu erhöhen. und jetzt sind die Kosten eines Roboters fünfmal niedriger als die eines Bedieners und achtmal niedriger als die eines externen Callcenters.

    Eine weitere Funktion SpeechKitCloud - Spracherkennung - ermöglicht es Kunden, im automatischen Modus eine Bestellung über das Telefon aufzugeben. Zusätzlich zu den Standardantworten ("Problem", "Zustellung", "Bestätigung") erkennt die Technologie heute Sätze wie "Lassen Sie uns arrangieren", "Ich weiß nicht", "Ich werde es abholen", "Okay". Gleichzeitig erkennt das System je nach Originalton, Codierungsqualität, Verständlichkeit und Sprachtempo, Komplexität der Phrasen und deren Länge etwa 82-95% der russischen Sprache. Der Einsatz von Technologie, wie im Fall der Sprachsynthese, reduziert in erster Linie die Belastung des Call Centers und kann es in Zukunft vollständig ersetzen, sofern die Qualität verbessert wird.

    In naher Zukunft

    Jetzt werden die Systeme nur noch zum Empfangen und Verteilen von ausgehenden und eingehenden Anrufen verwendet. Wir bei Calltouch sind jedoch zuversichtlich, dass dies nicht die Grenze ist, und planen, bis Ende des Jahres die Integration der Spracherkennungstechnologie in den Anrufverfolgungsdienst abzuschließen, um die Optimierung von Werbekampagnen und Geschäftsprozessen insgesamt auf ein neues Niveau zu bringen.

    Nehmen Sie zum Beispiel die Verteilung von Anrufen. Die meisten Geschäftsleute möchten heute lernen, wie sie den Ablauf von Telefonanrufen verwalten und diejenigen, die anrufen, um einen Kauf zu tätigen, von denen trennen, die an einer Beratung interessiert sind.

    Zum Beispiel, ein Spielzeugladen, der auf Yandex.Direct, Yandex Advertising Network (YAN) und das soziale Netzwerk VKontakte wirbt, frage ich mich, welche Quelle ihm Anrufe bringt, die mit Einkäufen enden. Angenommen, VKontakte führt hauptsächlich diejenigen an, die eine kostenlose Beratung, YAN-Anrufe beim Service und Yandex.Direct-Verkäufe wünschen. In diesem Fall lohnt es sich, die Budgets zugunsten von Yandex.Direct neu zu verteilen und gleichzeitig die Werbekosten im sozialen Netzwerk zu minimieren. Dies ist jedoch unmöglich, da nicht bekannt ist, wie die Anrufe potenzieller Kunden verteilt werden.

    Heute gibt es zwei Trennmethoden:

    1. Automatisch Beim Anrufen wird das Sprachsystem ausgelöst, das eine Auswahlmöglichkeit bietet: Taste „1“ wird an die Verkaufsabteilung weitergeleitet, Taste „2“ - an das Service-Center. Diese Informationen werden an das Anrufverfolgungssystem gesendet und analysiert.
    2. Mechanische . Der Unternehmenssekretär, der erkennt, dass der Kunde am Kauf interessiert ist, drückt die Nummer „1“, wenn die Dienste des Dienstes - die Nummer „2“. Der Service markiert die ersten Anrufe als "Verkauf", den zweiten als "Service" und erstellt eine Analyse basierend auf diesen Daten.


    Beide Methoden hängen vom menschlichen Faktor ab. Im ersten Fall ist es für den Kunden unpraktisch, eine zusätzliche Aktion auszuführen (drücken Sie die Tasten), und er legt auf oder drückt eine andere Nummer. Im zweiten Fall kann die Sekretärin vergessen, den Anruf zu markieren oder das Ergebnis zu "beenden", wenn beispielsweise sein KPI von der Anzahl der "Verkaufs" -Anrufe abhängt.

    Mit dem Aufkommen neuer Technologien kann der menschliche Faktor beseitigt werden. Wenn Sie dem System beibringen, die in Anzeigen am häufigsten verwendeten Schlüsselwörter zu verstehen, werden sie selbst in Gruppen unterteilt und der Anruf als "Verkauf" oder "Service" gekennzeichnet.

    Die Spracherkennung hilft auch bei der Kontrolle der Mitarbeiter. Zum Beispiel hat der Eigentümer eines Unternehmens das Gefühl, dass Untergebene sich nicht ändern, unhöflich gegenüber Kunden sind oder Anrufe verpassen. Sie können dies nur auf eine Weise überprüfen - indem Sie die Aufzeichnungen von Telefongesprächen anhören. Dies muss jedoch Zeit und Geld kosten, wenn Sie einen Mitarbeiter einstellen, um die Aufgabe zu erledigen. Während der Spracherkennungs-Anrufverfolgungsdienst automatisch auf vorhandene Probleme hinweist. Dazu werden Skripte und Vorlagen für die „korrekte“ Kommunikation mit Kunden auf das System heruntergeladen und festgelegt, wie oft ein Mitarbeiter diese Wörter sagen muss. Wenn das Programm sie in einem Gespräch erkennt, bedeutet dies, dass sich der Manager korrekt verhalten hat. Die Anrufverfolgung hilft dagegen dabei, aggressives Verhalten oder unangemessene Gespräche zu erkennen. Natürlich liefert die Methode kein absolutes Ergebnis.

    Durch die Analyse der von der Technologie bereitgestellten Informationen können Sie den Umsatz steigern. Das Programm identifiziert beispielsweise Wörter, die noch nie in Werbekampagnen verwendet wurden, aber die meisten Kunden sprechen sie aus, wenn sie den Laden anrufen. Es ist nützlich, solche Phrasen in Anzeigen einzufügen. Dies erweitert das Publikum des Kontexts und bringt mehr Wirkung als der übliche Text, den Marketingfachleute schreiben.

    Natürlich braucht es russische Anrufverfolgungsdienste, um die Sprache zu verstehen. Es besteht jedoch kein Zweifel, dass Benutzer die Möglichkeiten, die sich aus der Technologie ergeben, zu schätzen wissen.

    Quelle: SearchEngines.ru .

    Jetzt auch beliebt: