Найти в Дзене
6 подписчиков

Взялся за изучение обзорной статьи по всем достижениям в области LLM: "Large Language Models: A Survey".

Знания из статьи - отдельный рассказ. У этой статьи - более 200 ссылок на другие статьи с 1954 до 2023 года. Смотрю я на этот список и думаю: а что если взять вообще все статьи на arxiv и построить по ним PageRank или какой-то другой топ по цитированию. Потратив минут 5 на гугл, я не смог найти именно такой проект с графом цитирования. Потратив еще времени на поиск информации выяснил, что arxiv в своем апи доступа к данным о статьях скрывает данные о цитировании (что уже интересный и неочевидный факт). За то есть проект по парсингу цитирований из тестов статей здесь: huggingface.co/...set
Вообще было бы интересно сделать pet-проект по графу цитирований
Около минуты