Náttúruleg málvinnsla (NLP)

Hvað er náttúruleg málvinnsla (NLP)?

Natural Language Processing (NLP) er svið gervigreindar (AI) sem gerir tölvum kleift að greina og skilja mannamál, bæði ritað og talað. Það var mótað til að búa til hugbúnað sem býr til og skilur náttúruleg tungumál þannig að notandi geti átt náttúruleg samtöl við tölvu í stað þess að nota forritunarmál eða gervimál eins og Java eða C.

Að skilja náttúrulega málvinnslu (NLP)

Náttúruleg málvinnsla (NLP) er eitt skref í stærra verkefni fyrir tæknigeirann - nefnilega að nota gervigreind (AI) til að einfalda hvernig heimurinn virkar. Stafræni heimurinn hefur reynst mörgum fyrirtækjum breytilegur þar sem sífellt tæknifróðari íbúar finna nýjar leiðir til að eiga samskipti sín á milli á netinu og við fyrirtæki.

Samfélagsmiðlar hafa endurskilgreint merkingu samfélags; cryptocurrency hefur breytt stafrænu greiðsluviðmiðinu; Rafræn viðskipti hafa skapað nýja merkingu orðsins þægindi og skýgeymsla hefur innleitt annað stig gagnageymslu fyrir fjöldann.

Með gervigreind eru svið eins og vélanám og djúpnám að opna augu fyrir heimi allra möguleika. Vélnám er í auknum mæli notað í gagnagreiningum til að skilja stór gögn. Það er einnig notað til að forrita spjallbotna til að líkja eftir mannlegum samtölum við viðskiptavini. Hins vegar væri þessi framvirka notkun vélanáms ekki möguleg án spuna náttúrulegs málvinnslu (NLP).

Stig náttúrulegrar málvinnslu (NLP)

NLP sameinar gervigreind við tölvumálvísindi og tölvunarfræði til að vinna úr mönnum eða náttúrulegum tungumálum og tali. Hægt er að skipta ferlinu í þrjá hluta. Fyrsta verkefni NLP er að skilja náttúrulega tungumálið sem tölvan fær. Tölvan notar innbyggt tölfræðilíkan til að framkvæma talgreiningarrútínu sem breytir náttúrulegu tungumáli í forritunarmál. Það gerir þetta með því að skipta niður nýlegri ræðu sem það heyrir í örsmáar einingar og bera þessar einingar saman við fyrri einingar úr fyrri ræðu.

Úttakið eða niðurstaðan á textasniði ákvarðar tölfræðilega þau orð og setningar sem líklega voru sagðar. Þetta fyrsta verkefni er kallað tal-til-texta ferli.

Næsta verkefni er kallað orðatiltæki (POS) merking eða orðflokkaaðgreining. Þetta ferli auðkennir fyrst og fremst orð í málfræðilegri mynd sem nafnorð, sagnir, lýsingarorð, þátíð, o.s.frv. með því að nota safn af orðaforðareglum sem eru kóðaðar inn í tölvuna. Eftir þessi tvö ferli skilur tölvan nú líklega merkingu ræðunnar sem flutt var.

Þriðja skrefið sem NLP tekur er umbreyting texta í tal. Á þessu stigi er tölvuforritunarmálinu breytt í hljóð- eða textasnið fyrir notandann. Fjármálafréttaspjallbotn, til dæmis, sem er spurður spurningar eins og „Hvernig gengur Google í dag?“ mun líklegast skanna fjármálasíður á netinu fyrir Google hlutabréf og gæti ákveðið að velja aðeins upplýsingar eins og verð og magn sem svar.

Sérstök atriði

NLP reynir að gera tölvur greindar með því að láta menn trúa því að þeir séu í samskiptum við annan mann. Turing prófið,. sem Alan Turing lagði til árið 1950, segir að tölva geti verið fullkomlega greind ef hún getur hugsað og átt samtal eins og manneskja án þess að maðurinn viti að hún sé í raun að tala við vél.

Ein tölva árið 2014 stóðst prófið með sannfærandi hætti — spjallboti með persónu 13 ára drengs. Þetta er ekki þar með sagt að ómögulegt sé að smíða greindar vél, en hún útlistar erfiðleikana sem felast í því að láta tölvu hugsa eða tala eins og manneskju. Þar sem hægt er að nota orð í mismunandi samhengi og vélar hafa ekki þá raunveruleikareynslu sem menn hafa til að koma á framfæri og lýsa einingum í orðum, gæti það tekið smá tíma lengur áður en heimurinn getur algjörlega hætt við tölvuforritunarmál.

Hápunktar

Náttúruleg málvinnsla (NLP) notar tölvualgrím og gervigreind til að gera tölvum kleift að þekkja og bregðast við mannlegum samskiptum.
Texta-til-tal öpp, sem nú finnast á flestum iOS og Android kerfum, ásamt snjallhátölurum eins og Amazon Echo (Alexa) eða Google Home, hafa orðið alls staðar nálæg dæmi um NLP á undanförnum árum.
Þó að nokkrar NLP aðferðir séu til, fela þær venjulega í sér að brjóta tal eða texta í stakar undireiningar og bera þær síðan saman við gagnagrunn um hvernig þessar einingar passa saman miðað við fyrri reynslu.