Natural Language Processing (NLP) е поле на изкуствен интелект, което позволява на компютрите да анализират и разбират човешкия език. Той беше формулиран за изграждане на софтуер, който генерира и разбира естествените езици, така че потребителят да може да води естествени разговори със своя компютър вместо чрез програмиране или изкуствени езици като Java или C.
Разбиване на обработката на естествен език (NLP)
Обработката на естествен език (NLP) е една стъпка в по-голяма мисия за технологичния сектор - а именно да се използва изкуствен интелект (AI) за опростяване на начина, по който работи светът. Дигиталният свят се оказа изменител на игри за много компании, тъй като населението с все по-голяма технология намира нови начини за взаимодействие онлайн и с компании. Социалните медии предефинират значението на общността; криптовалутата промени нормата за цифрово плащане; електронната търговия създаде ново значение на думата удобство, а облачното съхранение въведе друго ниво на задържане на данни на масите.
Чрез AI области като машинно и дълбоко учене отварят очи към света на всички възможности. Машинното обучение все повече се използва в анализа на данни, за да има смисъл от големи данни. Използва се и за програмиране на чатботи за симулиране на човешки разговори с клиенти. Въпреки това, тези приложения на машинно обучение не биха били възможни без импровизация на обработката на естествен език (NLP).
Как НЛП всъщност работи?
NLP комбинира AI с компютърната лингвистика и компютърните науки за обработка на човешки или естествени езици и реч. Процесът може да бъде разбит на три части. Първата задача на NLP е да разбира естествения език, получен от компютъра. Компютърът използва вграден статистически модел за изпълнение на рутинно разпознаване на реч, който преобразува естествения език в език за програмиране. Това прави, като разгражда скорошна реч, която чува на миниатюрни единици и след това сравнява тези единици с предишни единици от предишна реч. Резултатът или резултатът в текстов формат статистически определя думите и изреченията, които са най-вероятно казани. Тази първа задача се нарича процес на реч в текст.
Следващата задача се нарича маркиране на част от речта (POS) или разминаване на категория на думи. Този процес елементарно идентифицира думите в техните граматически форми като съществителни имена, глаголи, прилагателни, минало време и др., Използвайки набор от лексиконови правила, кодирани в компютъра. След тези два процеса компютърът вероятно сега разбира значението на изказаната реч.
Третата стъпка, направена от НЛП, е преобразуване на текст в реч. На този етап компютърният език за програмиране се преобразува в звуков или текстов формат за потребителя. Например, чатбот за финансови новини, на който е зададен въпрос от рода на „Как се прави Google днес?“, Най-вероятно ще сканира онлайн финансови сайтове за акции на Google и може да реши да избере само информация като цена и обем като свой отговор.
НЛП се опитва да направи компютрите интелигентни, като кара хората да вярват, че взаимодействат с друг човек. Тестът на Тюринг, предложен от Алън Тюринг през 1950 г., гласи, че компютърът може да бъде напълно интелигентен, ако може да мисли и да води разговор като човек, без човекът да знае, че той или тя разговаря с машина. Засега само един компютър е преминал теста - чатбот с персоната на 13-годишно момче. Това не означава, че интелигентна машина е невъзможно да се изгради, но тя очертава трудностите, присъщи на това компютърът да мисли или да обръща внимание като човек. Тъй като думите могат да се използват в различен контекст, а машините нямат опит от реалния живот, който хората имат за предаване и описване на субекти с думи, може да отнеме още малко време, докато светът може напълно да премахне езика на компютърното програмиране.