24 подписчика
Сегодня хочу сделать небольшой анонс. Без поста о ПО.
Те кто вдруг не знает, у нас есть сайт https://soft-app-news.ru/ и бот @softAppNewsBot. И меня на все хватает, но с трудом, поэтому работы по ним ведутся медленно. Я хочу сделать раздел на сайте с альтернативами программ, такой чтобы можно было и по названию смотреть, например ввели Фотошоп и получили альтернативы. Так же по типу лицензий вроде проприетарной или свободной, с информацией о платности и бесплатности и ссылками на официальные источники. В России я таких аггрегаторов не нахожу, но за рубежом есть, правда тоже не много. Все карты раскрывать не буду, но хочу сделать российский аналог. Частично у нас такие функции есть в боте, но бот парсит в основном российские сайты, а там одни только проприетарные, а база альтернатив практически не пополняется, так как вручную это делать крайне трудоемко. Надеюсь стать крупным аггрегатором и хотя бы российское ПО будут добавлять в наш каталог сами разрботчики, по аналогии как это сделано на зарубежных сервисах. Самая большая проблема это конечно база данных программ, и хотелось бы, чтобы она была более менее крупная. Но с нуля такую базу собирать очень долго, а разработчики вряд ли захотят добавлять свои творения в "пустой" каталог. Таким образом, я принял решение сделать частичный парсинг зарубежных аггрегаторов, хотябы в плане свободного ПО. Парсинг оказался сложный, защиты от роботов, пришлось обходить, и мне это удалось, я уже собрал базу ссылок, теперь делаю парсер который будет собирать данные по ссылкам. Правда есть еще одна проблема - вся информация на английском. Чтобы решить эту проблему я хочу сначала спарсить побольше материала, а потом запустить переводчик и автоматом все перевести. В качестве сервиса для перевода я выбрал яндекс, так как он более менее доступен по цене, пусть перевод и не идеальный, но лучше чем у многих других сервисов. В былые времена я бы запустил краудфандинговую платформу на сбор денег, но в нынешних реалиях это невозможно, так как российских нет, а с зарубежными все крайне сложно, поэтому придется идти более мелкими шагами.
Буду парсить небольшими количествами и запускать переводчик по мере "достаточности" денег на это всё. Надеюсь тема будет интересной, и в конечном итоге парсить не придется всегда, а разработчики сами начнут добавлять свои программы в каталог.
Как это будет выглядеть!
Когда соберется хоть какая-то более менее небольшая база, я сделаю раздел на сайте, в котором можно будет уже искать, фильтровать и читать информацию. Чуть позже перенесу функциональность и в бота. Я вообще сначала хотел взять наработанную базу, и может быть я ее возьму, для проприетарного, но вот со свободным мало. Постов в канале около 200, для базы это не очем а описание очень уж эмоциональное для каталога. Такое не пойдет, поэтому контент в канале останется контентом в канале и в эту базу не попадет.
Если будет с этого хоть какой-то профит, то следующим этапом планируется купить свой хостинг для картинок, чтобы не тянуть те же иконки с зарубежных сайтов и можно будет делать полноценный каталог. На начальных этапах это будет просто каталог с фильтрами, закрытый от индексации поисковых систем. Вот такая дорожная карта анонсов, что хочется сделать. Если кто-то хочет поучастововать, кодом, идеями или еще как-то, вы знаете куда писать!
Спасибо за прочтение!
2 минуты
13 июля 2023