Was Ist mit der Verarbeitung Natürlicher Sprache, und Wie Funktioniert Es?

0
173
NicoElNino/Shutterstock.com

Verarbeitung natürlicher Sprache ermöglicht es Computern zu verarbeiten, was wir sagen, in Befehle, die es ausführen kann. Finden Sie heraus, wie die Grundlagen von, wie es funktioniert und wie es eingesetzt wird um unser Leben zu verbessern.

Was Ist Natural Language Processing?

Ob Alexa, Siri, Google Assistant, Bixby, oder Cortana, jeder mit einem smartphone oder smart-Lautsprecher verfügt über einen voice-activated Assistent heutzutage. Jedes Jahr, diese Stimme Assistenten scheinen besser zu erkennen und die Ausführung der Dinge, die wir sagen, zu tun. Aber haben Sie sich jemals gefragt, wie diese Assistenten verarbeiten Sie die Dinge, die wir sagen? Sie schaffen dies Dank Natural Language Processing-NLP.

Historisch gesehen, die meisten software, die bisher nur in der Lage zu reagieren, um eine Feste Reihe von spezifischen Befehlen. Eine Datei wird geöffnet, weil Sie auf Öffnen geklickt, oder eine Tabelle wird die Berechnung einer Formel basiert, die auf bestimmte Symbole und Formel-Namen. Ein Programm kommuniziert mit Hilfe der Programmiersprache, es wurde codiert, und werden somit produzieren eine Ausgabe, wenn es Eingaben, die es erkennt. In diesem Zusammenhang werden Wörter wie eine Reihe von verschiedenen mechanischen Hebel, dass immer die gewünschte Ausgabe.

Dies ist im Gegensatz zu den menschlichen Sprachen, die komplexe, unstrukturierte und haben eine Vielzahl von Bedeutungen, basierend auf Satzbau, Tonfall, Akzent, timing, Interpunktion und Kontext. Verarbeitung natürlicher Sprache ist ein Zweig der künstlichen Intelligenz, die versucht, diese Lücke überbrücken zwischen dem, was eine Maschine erkennt als Eingang und der menschlichen Sprache. Dies ist so, dass, wenn wir sprechen oder geben Sie natürlich, die Maschine produziert einen output im Einklang mit dem, was wir gesagt haben.

Dies geschieht durch die Einnahme von großen Mengen von Daten Punkte ableiten Bedeutung der verschiedenen Elemente der menschlichen Sprache, auf die Bedeutungen der Worte. Dieser Prozess ist eng verbunden mit dem Konzept, bekannt als machine-learning -, die ermöglicht es Computern, um mehr zu erfahren, wie Sie erhalten mehr Punkte von Daten. Das ist der Grund, warum die meisten der natural language processing Maschinen, die wir interagieren mit Häufig scheinen sich über die Zeit besser.

Zu beleuchten das Konzept besser, lassen Sie uns einen Blick auf zwei der bekanntesten top-level-Techniken in NLP, um Prozess-Sprache und information.

RELATED: Das Problem Mit der KI: Maschinen Lernen die Dinge, Aber Kann Sie nicht Verstehen

Tokenization

Tokenization bedeutet das aufteilen der Sprache in Wörter und Sätze. Jedes Stück text ist ein token, und diese tokens sind das, was erscheint, wenn Ihr die Rede ist, verarbeitet. Es klingt einfach, aber in der Praxis, es ist eine schwierige Prozess.

Lassen Sie uns sagen, dass Sie mit text-to-speech-software, wie z.B. die Google Tastatur, das senden einer Nachricht an einen Freund. Sie wollen die Nachricht, “Meet me at the park”. Wenn Ihr Telefon nimmt, dass eine Aufnahme und verarbeitet Sie durch die Google-text-to-speech-Algorithmus, Google muss dann aufgeteilt, was du gerade gesagt hast, in Jetons. Diese Token wäre “gerecht”, “mich”, “at”, “das” und “park”.

Menschen haben unterschiedliche Längen der Pausen zwischen den Worten, und andere Sprachen nicht haben sehr wenig in der Art von eine hörbare pause zwischen den Worten. Die tokenization-Prozess variiert drastisch zwischen den Sprachen und Dialekte.

STEMMEN und Lemmatization

STEMMEN und lemmatization beide beinhalten das entfernen von Erweiterungen oder Variationen zu einem Wurzel Wort, dass die Maschine erkennen kann. Dies geschieht, um die interpretation der Rede, die konsistent über verschiedene Wörter, die alle bedeuten im wesentlichen die gleiche Sache, die macht NLP Verarbeitung zu beschleunigen.

Stemming ist eine derbe schnell verarbeiten, das umfasst das entfernen von Affixen aus einer Wurzel, die Ergänzungen zu ein Wort angehängt, vor oder nach der Wurzel. Dies stellt das Wort in der einfachsten Grundform durch einfaches entfernen von Buchstaben. Zum Beispiel:

  • “Walking” verwandelt sich in “Fuß”
  • “Schneller” verwandelt sich in “schnell”
  • “Schwere” verwandelt sich in “sever”

Wie Sie sehen können, die sich möglicherweise nachteilig auswirken, verändert den Sinn eines Wortes komplett. “Schwere” und “sever” bedeuten nicht das gleiche, aber der suffix “E” wurde entfernt in den Prozess der Wortstamm.

Auf der anderen Seite, lemmatization ist ein anspruchsvoller Prozess, wodurch ein Wort zu Ihrer Basis, bekannt als das lemma. Dieser berücksichtigt den Kontext des Wortes und wie es verwendet wird, in einem Satz. Es beinhaltet auch die Suche nach einem Begriff in einer Datenbank von Wörtern und Ihrer jeweiligen lemma. Zum Beispiel:

  • “Sind” verwandelt sich in “werden”
  • “Betrieb” verwandelt sich in “Betrieb”
  • “Schwere” verwandelt sich in “schwerer”

In diesem Beispiel lemmatization gelungen, den Begriff “schwere” in die “starken”, die seiner lemma bilden und Wurzel.

NLP Use Cases und die Zukunft

Die vorherigen Beispiele nur ansatzweise an der Oberfläche kratzen, was die Verarbeitung Natürlicher Sprache ist. Es umfasst ein breites Spektrum von Verfahren und Einsatzszenarien, von denen viele wir in unserem täglichen Leben. Dies sind ein paar Beispiele, wo NLP ist derzeit in Verwendung:

  • Automatische Worterkennung: Bei der Eingabe einer Nachricht auf Ihr smartphone, es schlägt automatisch vor, Sie Wörter, die passen in den Satz oder die, die Sie verwendet haben, bevor.
  • Maschinelle Übersetzung: Weit verbreitete consumer-übersetzung-Diensten, wie Google Übersetzen, um eine high-level-form von NLP zu Prozess-Sprache und übersetzen.
  • Chatbots: NLP ist die Grundlage für intelligente chatbots, vor allem im Kundenservice, wo Sie können, unterstützen die Kunden und Ihre Anforderungen, bevor Sie das Gesicht einer realen person.

Es gibt mehr zu kommen. NLP nutzt werden derzeit entwickelt und eingesetzt in Bereichen wie Medien, Medizin-Technik, Arbeitsplatz, management und Finanzen. Es gibt eine chance, dass wir möglicherweise in der Lage, ein vollwertiges anspruchsvolle Unterhaltung mit einem Roboter in die Zukunft.

Wenn Sie daran interessiert sind, mehr über NLP, es gibt eine Menge von fantastischen Ressourcen auf die Richtung Data-Science-blog oder der Standford National Language Processing-Gruppe, die Sie heraus überprüfen können.

LESEN SIE WEITER

  • › So Deaktivieren Sie die AutoKorrektur auf Grammarly ist Browser-Erweiterung und Mobile-Tastatur
  • › Was Ist Kontakt-Tracing, und Wie Kann man Es Bekämpfen Pandemien?
  • › So Verwenden Sie die Netflix-Bildschirm Sperren Deaktivieren der Steuerelemente für die Wiedergabe
  • › Wie Bewegen Safari-Tabs Zwischen iPhone, iPad und Mac
  • › So Deaktivieren Sie das Einfügen-Taste auf Windows 10