Найти в Дзене
IQ.HSE

Как нас правят гаджеты: могут ли девайсы и глобальная сеть заменить справочник по грамматике

Wikimedia Commons
Wikimedia Commons

Для человека, который хочет изучать язык и его устройство, в сети доступно невероятное количество данных: самые разные тексты на всех возможных языках. Сейчас, например, мы можем не просто посмотреть, как люди употребляют новое слово, но и проследить, когда оно появилось в языке и как со временем меняется его значение. О том, как интернет изменил лингвистику, — в авторской колонке размышляет доцент Школы лингвистики НИУ ВШЭ, преподаватель Школы анализа данных «Яндекса», заведующий сектором теоретической семантики и ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН Борис Иомдин.

Вспомним, как было раньше? Выходили, допустим, словари новых слов. Откуда их авторы черпали информацию? В основном из собственных наблюдений: лингвист встречал где-то неизвестное слово, записывал его и постепенно накапливал материал. Но проверить — насколько это слово распространено — было очень трудно. Если сейчас вы заглянете в словарь актуальной лексики начала XXI века, вышедший в 2006 году, то обнаружите там, к примеру, слово «веб-таксофон». Но сейчас этого слова в языке нет. Да и тогда, скорее всего, по сути дела не было — поисковые системы почти не находят примеров. Мелькнуло и исчезло. «Спам» и «снек» остались, а «веб-таксофон» нет.

Зачастую, пока словарь готовят к изданию, редактируют — пока вся эта работа идет, слово успевает выйти из активного употребления или изменить значение.

Теперь даже для самых новых слов можно быстро получить статистику употребления — в интернете. Есть и методы автоматического выявления новых слов — скажем, в Твиттере. Но пока далеко не все можно решить без человека.

Писали мы как-то статью о сокращенных названиях бытовых предметов. Например, «велосипед» сейчас сокращают не только до знакомого многим «велик», но и до «вел». А если мы начнем изучать это слово в интернете, то столкнемся с проблемой, а именно с глаголом «вел» — только без точек. По контексту различить можно, но для этого нужно сесть и разбираться.

Говоря о языке и информационных технологиях, сложно уклониться от вопроса, ухудшает ли интернет грамотность. Однозначного ответа нет. С одной стороны, большинству пользователей интернет заменил орфографический словарь, а это не всегда надежно. Мой любимый пример — слово «борсетка». Да, именно так, через «о», это слово написано в орфографическом словаре, но написаний через «а» в интернете на порядок больше. Лингвист может обнаружить этот факт и сделать выводы, почему так получилось, чем оправдано одно и другое написание. А неспециалист просто использует вариант, который предлагают поисковые системы, не задумываясь — и тем самым нарушит норму. Для лексикографа интернет как огромное хранилище самых разных текстов — это замечательно, но для нелингвистов интернет как источник сведений об утвержденной норме — скорее плохо.

А хорошо ли, что компьютер и телефон исправляют за нас ошибки? Практика интернет-письма отличается от бумажной. Что написано пером, не вырубишь топором, а в Сети написанное обычно можно исправить. Это приводит к тому, что люди меньше следят за грамотностью: скорость важнее. Да и зачем напрягаться? Гаджеты нас поправят.

Когда школьники, да и взрослые, переписываются, а смартфон исправляет их ошибки, это, в принципе, неплохо — лучше, чем создавать неграмотные тексты, которых в интернете и так хватает. Но телефон может сделать такую замену, что потом краснеть придется: неудачным автоисправлениям посвящены целые разделы юмористических сайтов.

Впрочем, курьезами дело не исчерпывается. Ошибки в таких текстах все равно есть, просто они другие — их сложно исправить автоматически. Например, если я напишу «какова черта» вместо «какого чёрта», машина не исправит написанное, потому что оба этих слова существуют, а определить смысл высказывания гораздо сложнее, чем проверить его написание. Системы проверки орфографии постоянно совершенствуются, но главный принцип сохраняется: необычные написания исправляются на более частотные. А это не всегда уместно.

Например, я часто использую в переписке аббревиатуру ЗК — задачная комиссия олимпиады по лингвистике. А программа Punto постоянно переключает раскладку и исправляет ЗК на PR. Понятно, что для большинства людей PR важнее, чем ЗК (кстати, и аббревиатура-то эта, ЗК, обычно означает вовсе не задачную комиссию). Но лично я про PR вообще не пишу, а про ЗК — часто. Это то, что в компьютерной лингвистике называется «длинный хвост».

Статистика может много чего решить, может быть, 90% задач, но дальше остается длинный хвост из огромного количества очень редких случаев. У кого-то ЗК, у кого-то домашнее имя, кто-то из принципа в шутку всегда пишет не АнЕчка, а АнИчка. Это как если бы мы писали в школе записки одноклассникам, а кто-то сидел рядом и исправлял: думаю, нам бы показалось это неуместным.

Лингвисты сейчас активно изучают интернет в том числе и как среду коммуникации. Люди здесь правда пишут не так, как в других местах. Этой теме посвящен ряд исследований. Иногда интернет-пользователи даже провоцируют появление новых  норм! Например, в школе нас учат ставить точку после предложения; в интернете после реплик в диалоге точки можно увидеть все реже. А если они вдруг появляются, это может восприниматься как проявление агрессии.

Аналогично и с большими буквами — мы гораздо реже используем их в Сети (или в сети?). Некоторые люди и вовсе пишут только с маленькой, даже имена и в начале предложения — не потому, что они безграмотные, а вполне осознанно: «Хочу и пишу все маленькими буквами, это создает одно впечатление, хочу — все большими, совсем другое».

С кавычками история тоже меняется. Например, вот мы играем в «Шляпу» или в шляпу? Вроде бы это название игры и кавычки нужны. Но вот футбол — тоже игра, название которой, как и в «Шляпе», происходит от предмета, который для этой игры нужен: football, футбольный мяч. Футбол всегда пишут с маленькой буквы, а игру в шляпу — не всегда, но в интернете чаще. Играть в «Дочки-матери» или в дочки-матери? В «Магазин» или в магазин? На интернет-форумах кавычек и больших букв не будет, а в бумажных журналах редакторы могут и поставить. Даже дети, которые ведут активную онлайн-переписку, ощущают, что в глобальной сети другие правила. Они могут специально писать «харашо» вместо «хорошо» — не потому, что не знают, как правильно, и не потому, что так быстрее. Просто тут так можно — это чат, а не контрольная.

Кто-то может сказать в итоге, что интернет — рай для лингвиста, но ад для учителя. На самом деле все несколько сложнее. Интернет — это разнообразие и огромные возможности для самовыражения, что, конечно, здорово. Но многие, прежде всего, дети — те, кто еще не усвоил нормы, — склонны воспринимать вариации как эталон. Раньше считалось, что человек, который много читает, имеет все шансы быть грамотным. Теперь же дети читают далеко не только учебники и хорошо отредактированные книги, и обилие неграмотных текстов действительно может плохо сказаться на умении писать без орфографических ошибок. Но, с другой стороны, школьное сочинение с ошибками прочтет только учитель, а пост в интернете увидят и, возможно, прокомментируют — укажут на ошибки — разные люди, так что появляется новый стимул писать грамотно. Что окажется важнее, еще предстоит выяснить, и это очень интересно!
IQ

Текст впервые опубликован на сайте наших партнеров — медиа о науке и жизни oLogy

Автор текста: Борис Иомдин