Найти тему
Eleven Labs (это сервис для синтеза речи, и копирования голоса) выкатили очень интересную штуку
Eleven Labs (это сервис для синтеза речи, и копирования голоса) выкатили очень интересную штуку. Теперь можно просто наговорить фразу так, как ты сам её видишь — с твоими интонациями, акцентами и паузами, хоть шёпотом, хоть эмоционально. А дальше ИИ берёт и переносит твой стиль речи на абсолютно другой голос. Именно стиль — не голос...
2 часа назад
Раньше было как: сгенерировал картинку — и всё, дальше хоть головой об стену бейся, изменить очень сложно и больно. Но теперь правила изменились. OpenAI выкатили в ChatGPT-4o возможность редактировать картинки просто текстом. Реально просто пишешь, что хочешь поменять, и всё меняется прямо на глазах. И вот это уже совсем другая история. Можно делать реально крутые штуки: – Хочешь быстро поправить баннер без дизайнера? Пиши текстом: «Добавь котика справа». – Нужны классные карточки товаров на маркетплейс? Легко и красиво. И недорого. – Мемы? Теперь вообще без остановки. Короче, возможностей много и капец просто. OpenAI только что сломали интернет, кажется
4 дня назад
Затестил Gemini 2.5 на стихах, рил ток задача стихов решена 😎 Стих про Cookie Скроллю ленту, будто поле, Ловлю какой-то странный вайб. А куки-файл на вольном воле Мой каждый клик пихает в пайп. Запомнят, бро, твой лайк случайный, Кроссовки те, что заценил... И этот кринж, такой печальный, Ты будто в душу запустил. Потом тарге́т — нон-стоп атака, Весь шмот мелькает пред тобой. Не песнь полей, не лай собаки — А баннер с дикою мольбой. Куда ж ты, Русь? Где прежний муд твой? Экранный свет — не звездный свет. За кэш персданные сольют, бро... И рил ток, счастья больше нет.
5 дней назад
Гугл только что выкатил свежую модель — Gemini 2.5 Pro Это новая мощная рассуждающая модель от Google, в рейтинге LLM хорошо стоит. Надо тестировать на коде! Протестировать новую экспериментальную модель уже можно в Google AI Studio или через подписку Gemini Advanced. https://aistudio.google.com/prompts/new_chat
5 дней назад
Одна из крутых особенностей LLM (больших языковых моделей) — их способность превращать что-то сложное и непонятное во что-то простое и доступное. Причём не просто понятное вообще, а понятное именно тебе, с учётом твоего уникального опыта и бэкграунда. Но самое ценное даже не в том, что я могу быстро разобраться в чем-то сложном. Настоящая магия — в том, что теперь многие могут объяснить это сложное другим. ИИ становятся мостами между разными мирами понимания. Недавно поймал себя на забавном паттерне. Задумался о том, как человечество вообще додумалось до таких абстракций, как математика. И первый инстинкт — не погрузиться в книги, не позвонить умному другу, не загуглить, а спросить ChatGPT. Ждём поколение, которое ожидает мгновенного просветления по запросу. Ниже пример ответа про математику. Очень простым языком: Люди придумали математику, потому что им нужно было упрощать жизнь. Сначала они считали простые вещи: овец, яблоки, дни. Потом поняли, что удобно использовать символы (цифры), чтобы быстро передавать информацию и решать задачи без физического пересчёта предметов. Постепенно люди заметили закономерности и начали придумывать правила, чтобы ещё легче решать более сложные задачи. Так возникла математика. Как это происходило: 1. Сначала люди считали конкретные предметы (пять камней, три палки). 2. Потом появились цифры — удобные знаки для количества. 3. Затем придумали сложение и вычитание, чтобы быстро считать. 4. Дальше появились умножение и деление для ещё более удобного подсчёта. 5. Позже возникли уже совсем сложные абстрактные идеи (например, «ноль», «отрицательные числа», «дроби», «корень», «бесконечность»), которые помогали описывать мир ещё точнее и глубже. Современный пример для маркетолога: В наши дни таким примером абстракции могут быть «лайки» и «охваты» в соцсетях. Их ведь тоже не существует физически, это просто удобные модели того, насколько аудитории нравится твой контент или реклама. Чем больше лайков, тем лучше воспринимается твой товар. Это такая же абстракция, придуманная, чтобы не бегать лично к каждому клиенту и не спрашивать: «Ну что, как тебе мой пост?»
1 неделю назад
OpenAI снова выкатили кое-что интересное — пару новых моделей для работы с аудио. Я ещё раньше писал про их Sales-агента, и кажется, это всё ведёт к тому, что скоро мы будем много общаться с голосовыми агентами от OpenAI — и даже не поймём, что это не живой человек. Можно уже сейчас потестить и поиграться вот тут: https://www.openai.fm/. Кстати, в ту же тему есть ещё одна очень крутая штука — голосовой AI-агент от Sesame. Она умеет очень эмоционально и эмпатично вести разговор, прямо как настоящий человек. Когда я учил английский, о таком мечтал. https://www.sesame.com/
1 неделю назад
Недавно разбирался в теме векторизации — это такая штука, когда слова, тексты или любую другую информацию превращают в набор чисел (векторов). Зачем? Чтобы компьютеры могли легко анализировать и сравнивать их между собой. Работает примерно так: «Кошка» и «тигр» похожи по смыслу — значит, их векторы будут находиться рядом в математическом пространстве. «Автомобиль» и «тигр» — явно разное, так что их векторы разлетятся далеко друг от друга. Для бизнеса векторизация — вещь суперполезная. Можно сделать умный поиск по товарам или, например, наладить крутой поиск по внутренним документам. Сначала модель с помощью векторов быстро находит подходящие документы, а потом на их основе генерирует точный ответ. И всё бы отлично, но тут есть грустный нюанс: Оказывается, векторизация от Сбера стоит в 4-5 раз дороже, чем аналогичная от OpenAI. Такой вот бизнес...
1 неделю назад
Ребята из стартап-сообщества R Founders сделали очень удобную и полезную штуку — собрали в одном месте разные ИИ-инструменты для работы и аккуратно разложили по категориям. В основном там западные решения, но подборка реально классная. Никаких регистраций и смс— просто открываешь документ и сразу пользуешься. Ссылка тут: https://docs.google.com/spreadsheets/d/115NJQIZXyYQZWqtkufaQSWnriPT_c6NQgEQnwcOkLGE/edit?gid=0#gid=0
1 неделю назад
Хочу поделиться опытом работы с Vibe-кодингом (это когда пишешь код на естественном языке), потому что за последнее время удалось набить немало шишек и получить пару реально полезных инсайтов. Первое: модель решает всё. По рабочим задачам (не олимпиадные задачки с Leetcode, а именно реальный код) Claude 3.7 показывает себя лучше всех. Я пробовал писать на ChatGPT о3, но результаты были так себе, до сих пор не понимаю, откуда OpenAI берёт такие оптимистичные бенчмарки. Второе: сразу работайте в нормальной IDE — мой фаворит Cursor. Максимально удобный инструмент для такого подхода. Третье: сначала продумываем архитектуру — и только потом пишем код. Не обязательно быть супертехнарём и представлять все детали до мелочей. Главное — чётко понимать, какая будет база, какие процессы будут происходить, и как всё это будет взаимодействовать между собой. Если пропустить этот шаг, потом замучаетесь искать, где что-то отвалилось. Четвёртое: дробите задачи максимально мелко. В идеале каждый компонент должен быть отдельным микросервисом. Если пойдёт что-то не так (а это точно произойдёт), вы не потеряете весь проект целиком. LLM любят «лечить головную боль ампутацией головы», поэтому лучше не давать им такую возможность. Пятое: GitHub — просто сокровище. Хотите добавить крутые кнопки или майндкарты в приложение? Вбиваете в поиск «mindmap react github», скачиваете понравившуюся библиотеку, кидаете в папку проекта, просите LLM её проанализировать и встроить в ваш код. Профит гарантирован. Шестое: грамотный промптинг. Я заметил, что модель часто действует слишком прямолинейно. Если вы ей говорите «машина не едет, но газует», она запросто предложит вам отключить тормоза. Поэтому лучше явно попросить её сначала спокойно подумать и перечислить возможные причины проблемы, а потом уже что-то менять. В общем, как я уже говорил раньше, LLM реально демократизировали создание кода. Теперь маркетологи, менеджеры и все, кто раньше максимум собирал чат-боты на n8n, могут попробовать что-то гораздо более масштабное и интересное
2 недели назад
Tilda теперь тоже AI-продукт. Работает так: блоки сами собираются, картинки сами подбираются, тексты пишутся за тебя. Понятное дело, полноценную дизайн-студию это не заменит. Но когда нужно быстро собрать лендинг для тендера, показать прототип клиенту или просто протестировать идею — норм. Ссылка: https://tilda.ru/ru/lp/ai/
2 недели назад
Недавно услышал классный кейс, как в одной крупной российской компании адаптировали типичные корпоративные документы под разных сотрудников. Представьте обычный документ по корпоративным продажам: обычно сухой, серьёзный и максимально формальный. Но тут ребята начали внедрять ИИ и подумали: «А почему бы нам не адаптировать бизнес-процессы под разные категории сотрудников?». И сделали крутое: документ с классным, живым содержанием, но написанный простым языком и персонализированный под конкретные группы людей. Эффект оказался огненным. Честно скажу, когда написан под тебя и твои задачи, читать такое в разы интереснее. Думаю, кейс адаптации бизнес-процессов и упрощения контента с помощью ИИ — один из самых живых. Выше сам документ
2 недели назад
https://www.youtube.com/watch?v=hciNKcLwSes OpenAI провели стрим и наконец-то показали то, чего ждали, кажется, уже долго: полноценное API с возможностью поиска в интернете. Во-первых, WebSearch Tool. Теперь можно быстро (и без мучительных галлюцинаций!) искать информацию в интернете напрямую из API. Под капотом — дообученная модель GPT-4o или GPT-4o-mini, так что ответы максимально точные и свежие. Во-вторых, FileSearch Tool. Позволяет искать по своим документам и фильтровать их по тегам, которые вы сами назначаете. По сути, Ассистенты теперь в твоих руках и доступны через API. Это идеальная штука для создания умных ассистентов внутри компании или персонализированных баз знаний. Ну и третья пушка — API Computer Use (или Operator). Это аналог «оператора» от Anthropic, но на технологиях GPT. Теперь ты запускаешь "оператора" прямо на своём компьютере, а не только на сервере OpenAI. Доступен в режиме предварительного просмотра для отдельных разработчиков уровней использования 3–5. Стоимость: $3 за миллион входных токенов и $12 за миллион выходных токенов. Это буквально шаг к автономным AI-агентам, которые могут взаимодействовать с твоими файлами и приложениями напрямую.
2 недели назад