Найти в Дзене
Програмпроф

Что следует учесть при разработке программного обеспечении для эффективного поиска в соцсетях

Оглавление

Twitter и другие социальные сети повлияли на работу разработчиков и взаимодействия друг с другом. Ученые обнаружил, что Twitter «помогает им идти в ногу с быстро развивающейся средой разработки». Они используют Twitter, чтобы быть в курсе последних технологий, практик и инструментов, которые используют в работе. А также чтобы общаться с другими разработчиками и для создания сообществ вокруг проектов разработки программного обеспечения. Twitter играет большую роль в профессиональной деятельности разработчиков программного обеспечения.

Несмотря на пользу Twitter, его огромный масштаб создает ряд проблем для пользователей, включая разработчиков программного обеспечения. Основной проблемой, с которой сталкиваются разработчики, является поддержка соответствующей сети.

 https://www.firestock.ru/tvitter-twitter/
https://www.firestock.ru/tvitter-twitter/

Из-за того, что отслеживание других пользователей является предпочтительным способом получения информации из Twitter (помимо поиска), из-за отсутствия тщательной настройки сети разработчикам будет сложно найти интересную и полезную информацию.

Разработчики тщательно обдумывают, за кем хотели бы следовать. К сожалению, поиск подходящих пользователей для отслеживания среди более чем 328 миллионов пользователей в Twitter - нелегкая задача.

Для решения этого вопроса разработчики предложили автоматизированный подход, позволяющий идентифицировать специализированных гуру программного обеспечения из большого числа пользователей Twitter. Критерии для выбора специалиста специализированного программного обеспечения таковы:

  • должен быть опытным разработчиком программного обеспечения в специализированной области,
  • должен делиться полезной информацией с другими разработчиками в специализированной области.

Эта система рекомендаций идентифицирует специалистов программного обеспечения, найдя сначала подгруппу пользователей Twitter, которые потенциально заинтересованы в разработке программного обеспечения и которые генерируют твиты, связанные с доменом (например, твиты, упоминающие конкретную область интересов, например, Python). Затем извлекает различные типы особенностей каждого пользователя из этого набора пользователей домена (т.е. пользователей, которые генерируют твиты, связанные с доменом).

Эти функции можно сгруппировать в четыре семейства:

  1. содержание,
  2. сеть,
  3. профиль
  4. GitHub.

Исходя из этих особенностей, набор потенциальных пользователей анализируется в ходе двухэтапного процесса классификации, в результате чего создается дискриминационная модель (также известная как классификатор), которая отличает гуру специализированного программного обеспечения от других пользователей домена.

Полезные моменты для исследователей, заинтересованных в изучении проблем, лучшего поиска профилей с экспертами:

Эффективные и всеобъемлющие функции проектирования:

Набор данных, платформа и проблема сильно отличаются. Чтобы порекомендовать экспертов в Twitter, был разработан полный набор функций, проанализировав природу проблемы и данные. Это привело к построению более эффективной системы рекомендаций. Понимание характеристик необходимо для создания новых функций, которые будут играть важную роль в построении эффективных систем рекомендаций. Наличие эффективных функций может быть важнее, чем использование более мощных алгоритмов машинного обучения с точки зрения их влияния на качество рекомендаций.

Привлечение внешних ресурсов:

Функции, извлеченные из внешних ресурсов, связанных ссылками, такие как персональные веб-страницы пользователей и профили GitHub, помогают улучшить качество рекомендаций. Таким образом, исследователи, заинтересованные в решении подобных проблем, могут выйти за рамки данных, поступающих из одного источника. Дополнительные сведения об этой проблеме можно получить из связанных внешних источников.

 Photo by Szabo Viktor on Unsplash
Photo by Szabo Viktor on Unsplash

Распространять результаты опроса:

Исследователи часто отправляют свои опросы разработчикам, представленным в GitHub. Хотя этот метод может хорошо сработать и привести к тому, что доля ответивших превысит 15%, иногда в тех случаях, когда в центре внимания исследования находится конкретное сообщество разработчиков программного обеспечения, доля ответивших может снизиться.

Так обстоит дело с недавним исследованием, посвященным проблеме ослабления, в котором доля ответивших составила 7,84%. В первоначальном опросе был получен низкий процент ответов - менее 10%, когда выходили на разработчиков GitHub, случайно отобранными из GHTorrent. Возможно, это произошло так, потому что выборка, отобранная из GitHub, не была репрезентативной для разработчиков, использующих Twitter.

Исходя из этого был проведен новый опрос и связывались с разработчиками, которые на самом деле присутствовали в Twitter, используя персонализированные сообщения в Twitter. На этот раз количество ответивших возросла до 17,84%.

Таким образом, один из выводов заключается в том:

если необходимо исследовать проблемы относящиеся к конкретному сообществу разработчиков программного обеспечения, отбор проб должен проводиться только среди участников этой конкретной общины. Кроме того, вместо того, чтобы переписываться с разработчиками, личный контакт с ними по каналам, часто используемым членами целевого сообщества, например, прямой обмен сообщениями в Twitter также помогает получить больше ответов.