Самое удивительное, что мне попалось в книге основателя OkCupid Криса Раддера — это слово tchotchke. Оказалось, его занесли в английский говорившие на идише евреи, и это не что иное как "цацка".
Он пишет, что крепость брака измеряется степенью ассимиляции каждого супруга в сеть связей другого. Он даже сделал приложение, которое гадает по Фейсбуку на вероятность развода: чем больше друзей мужа из разных кластеров в друзьях у жены и наоборот, тем мощней у них happily ever after. Иными словами, если жена знакома со школьными друзьями мужа, коллегами, братьями-сестрами, однохоббистами и прочими собутыльниками, всё хорошо.
В 2015 году ФБ убрал некоторые разрешения в API, и приложение это больше не работает.
Кстати, по лайкам на ФБ в 2012 году можно было с точностью 88% идентифицировать гея, с точностью 75% — лесбиянку, с точностью 95% — белого/чёрного, с точностью 93% отличить мужчину от женщины, с точностью 85% — демократа от республиканца, с точностью 65% опознать наркомана, и с точностью 60% выявить ребенка, чьи родители развелись до того, как ему исполнился 21 год.
Еще я узнала, что для американцев очень важна политическая самоидентификация. Желание общаться друг с другом выше даже у убежденных протестантов и атеистов, чем у убежденных демократов и республиканцев.
Это особенно мило, если вспомнить, как "в 1950 году Американская Политологическая Ассоциация призвала к поляризации национальной политики — потому что партии слишком сблизились, стали похожи друг на друга, и людям стало сложно между ними выбирать", пишет Раддер. Ну что сказать, рекомендация была выполнена со всей старательностью.
Один ученый анализировал в соцсетях тексты, генерируемые участниками протестных движений. Оказалось, что если в текстах больше слов с позитивным смыслом, оно живет и развивается. А если с негативным, например, "hate," "not," "lame," and "never", то деградирует и умирает.
А Раддер анализирует слова и выражения, которые используют в текстах "о себе" пользователи OkCupid разных рас и ориентаций. С разделением по полам. Самая типичная для белого мужчины формулировка — "у меня голубые глаза". Вообще, белые предпочитают самоопределяться через внешность (глаза и волосы), азиаты — через родину (страна происхождения), латиносы через музыку (что слушают). В книге приведены интересные таблички самых типичных (см. картинки к посту) и атипичных слов для белых, азиатских, черных и латинских мужчин и женщин. Из них можно узнать, например, что негритянки совсем не пишут о загаре. А белые женщины чаще упоминают рыжие волосы, чем блондинистые.
Забавно, что среди самых редких для азиатов выражений — "чувство юмора", а азиатки, в отличие от остальных женщин, не пишут о своих детях.
Тем временем, негры захватывают твиттер: поведение черных мужчин на этом сервисе резко отличается от поведения всех других групп. Они формируют тесно связанный кластер, очень активно фолловят, ретвитят, реплаят, лайкают, и так далее, друг друга. Поэтому их любят всякие рекомендательные алгоритмы Твиттера, и они там dominate the conversation. Особенно это касается черных тинейджеров.
А вот еще интересная тема: поведение пользователей, которые называют себя бисексуалами.
Больше половины молодых бисексуалов пишет только мужчинам, с возрастом процент таких людей падает, а начиная с возраста около 35 большинство бисексуалов пишет только женщинам. Раддер предполагает, это потому, что геи с возрастом смиряются со своей ориентацией и перестают называть себя бисексуалами.
А для женщин, называющих себя бисексуальными, статистика другая: в основном это делают боты, созданные для развода пользователей на деньги. Видимо, такая самоидентификация привлекает мужчин. На Фейсбуке, например, 58% фейковых аккаунтов — "бисексуалки". Поэтому на OkCupid к бисексуалкам очень внимательно присматриваются антиспамовые алгоритмы.