Мы написали уже о нескольких применениях Искусственного Интеллекта, и пора открыть серию постов об обработке языка – natural language processing, или NLP. Идея проста – компьютеру дается обычный, неструктурированный текст, и алгоритм пытается что-то о нём узнать. Есть несколько задач, которые можно при этом решать. Первая – понять, о чем текст. Например, это полезно для сортировки емэйлов – приходит клиентский запрос, и его нужно классифицировать, чтобы направить в соответствующий отдел. Здесь алгоритм распределяет запросы на несколько групп – «новые заказы», «послепродажное обслуживание», «сопутствующие услуги» или «иное». Сейчас это делается с очень высокой точностью. Поисковики решают другую задачу – перебирают сайты и находят те, которые наиболее соответствуют запросу. Фактически, им нужно уметь определить степень соответствия любых двух текстов друг другу, при этом делать это невероятно быстро. Большой интерес сейчас к принципиально иному направлению – анализу тональности (“sentim