Dutch

Wat Is de Verwerking van Natuurlijke Taal, en Hoe Werkt Het?

Apr 21, 2020

253

De verwerking van natuurlijke taal kunnen computers te verwerken wat we zeggen naar commando ‘ s die het kan uitvoeren. Zoek uit hoe de basis van hoe het werkt, en hoe het wordt gebruikt om onze levens te verbeteren.

Wat Is De Verwerking Van Natuurlijke Taal?

Of het nu Alexa, Siri, Google-Assistent, Bixby, of Cortana, iedereen met een smartphone of smart speaker heeft een spraakgestuurde assistent tegenwoordig. Elk jaar, deze stem assistenten blijken steeds beter in het herkennen van en het uitvoeren van de dingen die we zeggen te doen. Maar heb je je ooit afgevraagd hoe deze medewerkers het verwerken van de dingen die we zeggen? Ze lukt om dit te doen dankzij de Verwerking van Natuurlijke Taal, of NLP.

Historisch gezien zijn de meeste software is alleen in staat geweest om te reageren op een vaste set van specifieke opdrachten. Een bestand wordt geopend, omdat u hebt geklikt Openen, of een werkblad wordt het berekenen van een formule die gebaseerd is op bepaalde symbolen en formule namen. Een programma communiceert met de programmeertaal die werd gecodeerd in, en zal dus het produceren van output als het wordt gegeven input die het herkent. In deze context zijn woorden zijn als een set van verschillende mechanische hefbomen die altijd zorgen voor de gewenste output.

Dit is in tegenstelling tot de menselijke taal, die complexe, ongestructureerde, en een veelheid aan betekenissen op basis van zin-structuur, de toon, het accent, de timing, de interpunctie en de context. De Verwerking van natuurlijke Taal is een tak van kunstmatige intelligentie die probeert om die kloof te overbruggen tussen wat een machine herkent als input en de menselijke taal. Dit is zo, dat wanneer we spreken of type van nature, produceert de machine een resultaat in lijn met wat we zeiden.

Dit wordt gedaan door het nemen van grote hoeveelheden data punten voor het afleiden van de betekenis van de verschillende elementen van de menselijke taal, op de top van de betekenissen van de werkelijke woorden. Dit proces is nauw verbonden met het concept van de zogenaamde ‘machine learning’, waarmee computers om te leren meer als ze meer punten krijgen van de gegevens. Dat is de reden waarom de meeste van de verwerking van natuurlijke taal machines we de interactie met vaak lijken te beter de loop van de tijd.

Voor het verlichten van de concept beter, laten we eens kijken naar twee van de meest in het top-niveau van de gebruikte technieken in de NLP om taal te verwerken en informatie.

GERELATEERD: Het Probleem Met AI: Machines Zijn die Dingen Leren, Maar Kan het niet Begrijpen

Tokenization

Tokenization betekent het splitsen van spraak in woorden of zinnen. Elk stuk van de tekst is een token, en deze lopers zijn wat laten zien wanneer uw stem wordt verwerkt. Het klinkt eenvoudig, maar in de praktijk, het is een lastig proces.

Laten we zeggen dat u het gebruik van tekst-naar-spraak-software, zoals de Google Toetsenbord om een bericht te sturen naar een vriend. U wilt boodschap, “Meet me at the park”. Wanneer uw telefoon vindt dat de opname en verwerking door Google ‘ s tekst-naar-spraak-algoritme, Google moet dan splitsen wat je net zei in tokens. Deze tokens zou worden “voldoen”, “mij”, “op”, “de,” en “park”.

Mensen hebben een verschillende lengte van de pauzes tussen de woorden, en andere talen worden mogelijk niet weinig in de weg van een hoorbare pauze tussen de woorden. De tokenization proces verschilt drastisch tussen talen en dialecten.

Gevolg en Lemmatisering

Gevolg en lemmatisering beide te betrekken in het proces van het verwijderen van aanvullingen en / of wijzigingen in de aan een stamwoord dat de machine kan herkennen. Dit is gedaan om de interpretatie van meningsuiting consistent in de verschillende woorden die allemaal in wezen hetzelfde betekenen, en dat maakt NLP verwerking sneller.

Gevolg is een ruwe snel proces dat bestaat uit het verwijderen van affixen van een stamwoord, dat zijn toevoegingen aan een woord gekoppeld vóór of na de root. Dit zet het woord in de eenvoudigste basis vorm door het eenvoudig verwijderen van letters. Bijvoorbeeld:

“Wandelen” verandert in “lopen”
“Sneller” verandert in “snel”
“Ernst” verandert in “verbreken”

Zoals u kunt zien, die afkomstig kan zijn van de negatieve gevolgen van het veranderen van de betekenis van een woord volledig. “Ernst” en “server” betekenen niet hetzelfde, maar het achtervoegsel “stad” werd verwijderd in het proces van het gevolg.

Aan de andere kant, lemmatisering is een meer geavanceerd proces dat draait om het verminderen van een woord aan hun voet, die bekend staat als het lemma. Dit houdt rekening met de context van het woord en hoe het gebruikt wordt in een zin. Het omvat ook het opzoeken van een term in een database van woorden en hun respectieve lemma. Bijvoorbeeld:

“Zijn” verandert in “zijn”
“Operatie” verandert in “werken”
“Ernst” verandert in “ernstige”

In dit voorbeeld, lemmatisering het voor elkaar gekregen dat de term “ernst” in “ernstige” dat is het lemma vorm en wortel woord.

NLP Use Cases en de Toekomst

In de vorige voorbeelden alleen begint te krassen op het oppervlak van wat de Verwerking van Natuurlijke Taal is. Het omvat een breed scala van praktijken en het gebruik van scenario ‘ s, veel van die we gebruiken in ons dagelijks leven. Dit zijn een paar voorbeelden van waar NLP is momenteel in gebruik:

Voorspellende Tekst: Wanneer u een bericht typt op je smartphone, het automatisch suggereert dat je de woorden die passen in de zin, of dat u eerder hebt gebruikt.
Machine Vertaling: Wijd gebruikt consument het vertalen van diensten, zoals Google Translate, tot het opnemen van een hoog niveau vorm van NLP om taal te verwerken en te vertalen.
Chatbots: NLP is de basis voor intelligente chatbots, vooral in de klantenservice, waar ze kunnen helpen bij klanten en het proces van hun aanvragen voordat ze het gezicht van een echte persoon.

Er is meer te komen. NLP gebruikt worden momenteel ontwikkeld en ingezet in gebieden zoals nieuws, media, medische technologie, werkplek beheer en financiën. Er is een kans dat we kunnen in staat zijn om een volwaardige geavanceerde gesprek met een robot in de toekomst.

Als u geïnteresseerd bent in het leren meer over NLP, er zijn een heleboel van fantastische middelen op de Richting van Data Science blog of de Standford Nationale Taal Verwerking van de Groep die u kunt controleren.

LEES VERDER

“Wat Is Contact Tracing, en Hoe Kan Het de Bestrijding van Pandemieën?
“Het Gebruik van Netflix de schermvergrendeling Uitschakelen Besturingselementen voor Afspelen
“Het Verplaatsen van Safari Tabbladen Tussen de iPhone, iPad en Mac
“Het Uitschakelen van de Insert-Toets (Windows) ingedrukt 10
“Wat Is Identificatie Vulling? (en Hoe om Jezelf te Beschermen)