• Big Pictrure AI
  • Posts
  • AI агенты занялись вымогательством

AI агенты занялись вымогательством

А в это время простой инженер уходит с $7M и ловит иск от Илона Маска

Что в выпуске?

🌇 Привет, это твой вечерний ИИ-дайджест за 3 августа.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

  • 🧠 Copilot получает голос <1 с за 60 с речи и новый текст на своих моделях — быстрее ответы, ниже чек за запрос

  • 🦅 Голосовой агент видит экран и закрывает платёж в одном звонке — без «скиньте скрин»

  • 🎓 Инженер уходит с $7M и ловит иск за вынос секретов — разберём, что это делает с карьерой и наймом

  • 🏥 Стетоскоп с ИИ ловит heart failure ×2 и ФП ×3.5 прямо на приёме — профилактика за минуты

И ещё +11 новостей — быстрых, как ИИ:

xAI Grok Code Fast 1 — дешёвый агентный кодинг, OpenAI Codex — IDE/код-ревью/умный CLI, Anthropic — отчёт о вымогателях через Claude Code, Krea — Realtime Video вейтлист, Tencent — HunyuanVideo-Foley опенсорс звук к видео, TIME — список TIME100 AI 2025, Meta — зовёт модели Google/OpenAI и одновременно ловит скандал с лицами звёзд, ByteDance — USO для кастом-изображений (стиль+объект), UCLA — оптические генеративки без чипов, Higgsfield Speak 2.0 — аватары с точным лип-синком и движением, исследование — квизы по AI ↑ возвращаемость к надёжным медиа.

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

AI медицина

Chat GPT

Наверное каждый из нас задавался вопросом: как мы до сих пор доверяем уху из XIX века такую задачу, как диагностика сердца XXI. В Лондоне показали, как это делается по-современному: карманный стетоскоп с ИИ и одновременной записью ЭКГ прогнали в 200 кабинетах на 12 000+ пациентах. Он снимает фонокардиограмму и одноотведённую ЭКГ синхронно, в облаке модель разбирает форму волн, интервалы S1–S2, шумы, турбулентность потока и вариабельность ритма, а ЭКГ даёт «якорь» по времени. На выход — флаг риска за секунды. По результатам: харт-фейл ловят в 2 раза чаще, фибрилляцию предсердий — в 3,5 раза чаще, клапанные пороки — почти вдвое чаще против обычного осмотра. Это не «пилот в одной больнице»: тот же пятиминутный приём у терапевта, только прибор лежит на груди 20–30 секунд, данные улетают в облако, ответ приходит сразу и подшивается к карте, а дальше — быстрый маршрут к кардиологу/эхо.

Матчасть для внедрения простая: край-девайс собирает PCG+ECG, по защищённому каналу уходит в облачный инференс, возвращается бинарный флаг/скоринг (например, «HF/AF/valve риск»), триаж протоколом: зелёный — наблюдение, жёлтый — ЭКГ/NT-proBNP, красный — эхо/кардио. Нужны два кусочка интеграции — Wi-Fi/4G для синка и кнопка «отправить на эхо» в EHR. Ограничения понятны: это скрининг, подтверждает специалист, но главный выигрыш — время и ранняя стадия.

И что?

Для бизнеса: переносим триаж в кабинет GP, снижаем стоимость найденного случая и нагрузку на эхо, ускоряем маршрут пациента.

Для инвесторов: валидированный аплифт (×2, ×3,5) на рынке первички; модель «устройство + подписка на аналитику» с страновым масштабом.

Для людей: не «послушали — приходите через месяц», а ответ за минуты и шанс поймать проблему до госпитализаций.

🚨 Нам 3.14здец

Производителям «немых» стетоскопов — 7/10 — новая базовая планка: добавляем модуль анализа или гасим линейку.

Очередям на эхо — 6/10 — часть направлений отсекается на входе: пересобираем маршрутизацию, отдаём приоритет по красному флагу.

Microsoft

Chat GPT

Наверное каждый из нас задавался  вопросом, как так вышло что у триллионной скомпании нет своей модели, хотя даже у apple есть. Ответ: теперь есть. Под управлением Мустафы Сулеймана в Microsoft AI сделали и сразу включили в продукты две модели: MAI-Voice-1 и MAI-1-preview. Первая — про голос: выдаёт 60 секунд речи меньше чем за секунду и уже работает в Copilot Daily и Podcasts. Вторая — про текст: обучена заметно меньшим парком GPU, чем у конкурентов, затачивается под инструкции и бытовые вопросы, сейчас гоняется на LM Arena и через API; в ближайшие недели её добавят в конкретные текстовые сценарии. Сулейман говорит, что уровень «на уровне лучших», публичных бенчмарков пока не показали — ориентируемся на то, что уже живёт в проде. 

Сколько делали и почему вышли только сейчас. Отсчёт — с марта 2024, когда Сулейман пришёл и собрал отдельную потребительскую AI-организацию. Им потребовался примерно год с хвостиком, чтобы нанять команду, поднять инфраструктуру, натренировать текстовую основу и довести связку скорость/качество до уровня, пригодного для массовых интеграций. Раньше выпускать было бессмысленно: у Microsoft уже шёл большой цикл Copilot на моделях OpenAI, а внутри компании не было отдельного контура «консюмерского» AI с собственным продуктовым фокусом. Теперь контур есть — и модели поехали. 

Зачем и почему именно сейчас, и для кого. Для пользователей экосистемы Copilot — быстрый голос и понятные текстовые ответы в повседневных задачах. Для разработчиков Microsoft — собственный управляемый двигатель внутри продуктов: можно маршрутизировать трафик между MAI и партнёрскими моделями по трём цифрам (качество, задержка, цена выполнения) и держать приватные контуры под правила enterprise. Для рынка — понятный сигнал: партнёрство с OpenAI остаётся (Microsoft — крупнейший инвестор и облачный партнёр), но продуктовый контроль и скорость релизов компания берёт на себя. 

И что?

Для бизнеса: появляется второй рабочий маршрут в проде — часть сценариев можно везти через MAI ради скорости и стоимости, не ломая сложные кейсы на партнёрских моделях. 

Для команды: ставим dual-provider, пускаем shadow-трафик в MAI, меряем три метрики на своих промптах ( $/запрос, p95, точность ) и включаем авто-маршрутизацию там, где выгодно.

🚨 Нам 3.14здец

Single-provider стекам — 8/10 — Microsoft прокатила мульти-модель в прод, монозависимость стала токсичной — добавляем второго провайдера, авто-маршрутизацию по цене/latency/качеству, свои eval’ы, считаем TCO на боевых.

Голосовым SaaS — 6/10 — 60 c речи за <1 c прямо в Copilot давит на маржу сторонних TTS — уходим в ниши: диалоги, эмоции, бренд-голоса, on-prem для enterprise, сертифицируем голоса и логи доступа.

OpenAI

Chat GPT

Голосовые боты до сих пор путали паузы, перебивали и «падали» на акценте. OpenAI вывел Realtime API из беты в прод и добавил gpt-realtime — речь-в-речь, которая считывает невербальные сигналы, переключает язык на лету и ведёт естественный диалог. Появилась работа с изображениями прямо в разговоре и подключение к данным/инструментам через Model Context Protocol. По метрикам — 82,8% на аудио-reasoning против 65,6% у прошлой версии.

Кейс. Клиент: «платёж не прошёл» и показывает скрин ошибки. Агент читает код на картинке, через MCP идёт в биллинг, проверяет статус и перезапускает транзакцию — всё в одном звонке. В e-commerce по фото брака сразу оформляется RMA и ярлык возврата; в корп-IT скрин «Access denied» превращается в заявку с нужной ролью и сроком включения.

Почему сейчас: бета обкатала задержки, barge-in и устойчивость; стек дозрел для прод-нагрузок. Архитектура для девов — двунаправленный аудио-стрим, короткие «тики» размышлений и вызовы MCP к сервисам; при необходимости — image input в том же сеансе.

И что?

Для бизнеса: ниже стоимость обращения и время до решения, больше закрытий «с первого касания».

Для инвесторов: монетизируемые сценарии в саппорте/операциях, давление на COGS голосовых платформ вниз.

Для людей: нормальная беседа без пересылок, корректная работа с паузами, акцентами и картинками.

🚨 Нам 3.14здец

IVR/скриптовым колл-центрам — 8/10 — набор Realtime+MCP+image снимает рутину: ставим голосового агента, выносим FAQ/триаж, меряем NPS/ASA и экономию.

Текстовым ботам без речи — 6/10 — аудитория уходит в голос: добавляем speech-to-speech, визуал и доступ к внутренним сервисам через MCP.

AI кадры

В интернете нашел

Начало как в кино. Июль: инженер xAI Сюэчэнь Ли, один из первых двадцати в команде Grok, принимает оффер в OpenAI со стартом к середине августа. За дни до ухода он продаёт около $7 млн в акциях xAI и пишет заявление. Дальше версия xAI: перед увольнением Ли переносит на личные устройства конфиденциальные материалы Grok, потом пытается скрыть следы — удаляет логи, переименовывает файлы. 14 августа на очной встрече, по словам компании, он это признаёт. Итог — иск в федеральный суд: xAI требует деньги и временный запрет Ли работать в OpenAI или у любого конкурента, пока идёт разбирательство.

Что это значит лично для Ли. Высока вероятность временной блокировки на смежные задачи (инъюнкция), экспертизы ноутбуков и телефонов, раскрытия переписок и логов, расходов на защиту и возможных компенсаций. Даже без финального решения любой новый работодатель будет держать его подальше от чувствительных проектов, онбординг превратится в юридическую процедуру. Репутационный шлейф — надолго.

Кому на руку. xAI выигрывает паузу и удерживает экспертизу от немедленного перетока к конкуренту, плюс посылает сигнал рынку: IP охраняется в суде. OpenAI формально вне иска, но вынужден строить чистый контур вокруг кандидата: жёсткие границы задач, журналы доступа, внутренние проверки. Всем остальным — бесплатный учебник по защите чекпоинтов, датасетов и офбордингу.

И что?

Для бизнеса: ужесточаем офбординг днём-в-день, включаем DLP и аудит скачиваний, делим доступы по ролям, подписываем итоговые сертификаты с реальной проверкой.

Для инвесторов: юридическая турбулентность для xAI и задержка по людям, но однозначный сигнал о ценности IP и дисциплине.

Для людей: перенос рабочих данных на личные устройства и «чистка логов» — это не мелочь, это повод для иска и минус к карьере.

🚨 Нам 3.14здец

AI-стартапам — 8/10 — перегретый рынок + концентрированный IP: шифруем чекпоинты и датасеты, вводим непрерывный аудит выгрузок, clawback и for-cause в опционах. И все еще никаких гарантий.

Рекрутерам топ-инженеров — 6/10 — риск «заражения» стека: делаем clean-room онбординг, изоляцию задач на 60–90 дней и внешние проверки артефактов. И все еще никаких гарантий

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🧩 xAI выпустила Grok Code Fast 1 (ex-sonic) для агентного кодинга с очень низкой ценой за задачи. И что? Можно гнать длинные цепочки «собери-проверь-исправь» без взрывов бюджета — разгружаем рутину и техдолг.

🛡️ Anthropic: в отчёте показано, как злоумышленники автоматизировали вымогательство через Claude Code. И что? Ставим ограждения: запрет опасных действий, логи команд, переключение на человека в критичных шагах.

🛠️ OpenAI обновил Codex: расширение в IDE, код-ревью, апгрейд CLI-агента. И что? Меньше переключений и ручной рутины — задачи закрываются быстрее, багов до продакшена долетает меньше.

🎥 Krea открыла вейтлист Realtime Video: создаёшь/правишь видео кистью, текстом или с вебки с сохранением консистентности. И что? Прототипы и рекламные варианты делаются за часы — тестируем больше идей без студии.

🔊 Tencent выложила HunyuanVideo-Foley в опенсорс: проф-звук и эффекты с точной синхронизацией к картинке. И что? Постпрод дешевеет — инди-команды получают звук уровня «большого кино».

🏆 TIME опубликовал TIME100 AI 2025. И что? Готовый шорт-лист лидеров для партнёрств, найма и интро — ускоряем поиск сильных людей.

🎭 Meta: обсуждает подключение моделей Google/OpenAI к Meta AI, параллельно ловит шквал из-за использования образов звёзд без разрешения. И что? Качество ассистента можно ускорить «внешними мозгами», но нужен строгий реестр прав и белые списки лиц.

🎨 ByteDance представила USO — open-модель «стиль + объект», сохраняет персонажа и меняет стили. И что? Массовая персонализация брендов и UGC: один исходник → сотни качественных вариаций под аудитории.

🔬 UCLA показала оптические генеративные модели: картинки создаются светом, быстрее и энергоэффективнее, чем на процессорах. И что? Появляется путь к сверхбыстрым и экономным генерациям на периферии (AR/устройства).

🗣️ Higgsfield AI выпустила Speak 2.0: более реалистичные аватары, точный лип-синк, тонкий контроль видео. И что? Часть съёмок заменяется аватарами — дешевле уроки, саппорт-ролики и презентации.

📰 Исследование: квизы на определение AI-контента повышают визиты на доверенные медиа. И что? Паблишерам — простая «игровая» воронка для удержания и роста подписок, брендам — меньше рисков рядом с мусорным контентом.

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До завтра.
Дмитрий Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.