Что в выпуске?

☕️ Привет, это твой утренний ИИ-дайджест за 15 июля.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

🛠️METR обнаруживает парадокс: с AI-ассистентом девелоперы тратят на 19 % больше времени, но чувствуют себя быстрее
💰Google платит 2,4 млрд $ за лицензию Windsurf и переводит ключевых фаундеров в команду Gemini
🌕Триллионный Kimi-K2 ставит новые рекорды на код-бенчмарках с открытыми весами

⚡ и ещё + 6 новостей — быстрых, как ИИ: OpenAI, Tesla, xAI, Meta, Microsoft и свежие апдейты Grok

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

Исследование

🦹 Мы думали, ИИ экономит время. Оказалось — ворует

Chat GPT

🧪 METR — небольшой институт из Беркли, известный тем, что ломает громкие заявления об ИИ на практических стресс-тестах. Весной им надоело читать посты о «суперпродуктивности» с ассистентами, и команда придумала испытание: взять проверенных опен-сорс-ветеранов, посадить за огромные проекты и засечь время по секундомеру.

Как проверяли

Выбрали 16 девелоперов, дали им 246 живых задач в репозиториях по миллиону строк кода. Перед стартом ребята оценили бонус в –24 % времени с Cursor Pro. На деле вышло +19 %. Чистый набор текста сократился, зато выросли минуты на формулировку промптов, чтение ответов и ожидание генерации.

Почему ощущения расходятся с часами

После коммита те же разработчики сказали, что якобы ускорились на 20 %. METR объясняет: ассистент снимает когнитивное напряжение — мозг воспринимает работу как лёгкую, даже когда стрелка таймера уходит вправо.

И что?

Для бизнеса — считать эффект ИИ лишь хронометром рискованно; важнее, как снижаются когнитивные затраты на поддержку крупного кода.

Для инвесторов — обещание «сократим время» требует уточнений, но рынок ассистентов с сильной UX-ценностью остаётся перспективным.

Для рынка — появится волна инструментов, оптимизирующих именно промпты и ревью машинного кода, чтобы вернуть секунды на место.

Китайские Open Source

👨🏿‍💻Открытая триллионная Kimi делает код лучше GPT-4.1

Moonshot AI

🌕 Moonshot AI выкатила Kimi-K2 — модель на триллион параметров с открытыми весами, которая обходит GPT-4.1 и Claude 4 Opus на кодинг-бенчмарках и ставит новые рекорды по математике и STEM среди систем без отдельного reasoning-блока. Главная фишка — длинные агентные цепочки: K2 принимает задачу, подбирает инструменты, тянет данные, считает и даже бронирует поездки в одной сессии.

За стабильность отвечает новый движок MuonClip: вся двухмесячная учёба прошла без единого краша, убрав самую дорогую строку — перезапуски на сотнях GPU. Команда из Пекина гоняла 6 000 A100; по рынку это около 270 млн $. MuonClip урезал итоговый чек почти втрое за счёт аккуратного клипинга градиентов. Пока K2 работает только с текстом, но Moonshot обещает добавить мультимодаль и reasoning, оставив всё в открытом доступе. Выложены и инструкции по доучиванию: можно заливать корпоративные данные локально без привязки к проприетарным API.

Главный кайф триллиона параметров — это:

Вместимость. Внутри — тысячи микроспециалистов. Один фрагмент держит синтаксис Rust, другой помнит фармацевтические паттерны. Модель не переключается между задачами, она ведёт их параллельно, как команда в Slack.

Длинное планирование. Когда цепочка включает десятки шагов — собрать данные, рассчитать, сшить отчёт, задеплоить — маленькая сеть теряется. Триллионник удерживает весь контекст и не сбрасывает стек мыслей посредине скрипта.

Стабильный код. На код-бенчмарках K2 обходит GPT-4.1. Причина в том, что огромный корпус параметров хранит редкие идиомы и edge-кейсы, которые мелкие сети просто не видели.

Широкое окно. Архитектура держит огромные промпты (сотни тысяч токенов). Это значит: запихнули всю документацию, регламенты, данные — и модель ведёт проект, не забывая, что было на первом экране.

Open weights. Объём + открытый доступ = контроль. Можно крутить на своих GPU, шифровать клиентские данные, пилить приватные агенты, экономя облачные лимиты.

Прикладные сценарии

Биотех. Лаборатория бросает в Kimi данные по белкам, получает сгенерированные блоки кода для симуляций, сразу запускает эксперименты in silico. Ошибки вылавливаются ботом до запуска реакторов. Выгода: меньше холостых раундов, экономия миллионов на реагентах.

E-commerce. Магазин скармливает модели историю кликов, товары и акции. K2 пишет скрипт персонализации, выкатывает A/B-тест, сам собирает статистику и разворачивает победителя. Выгода: рост среднего чека без команды дата-сайентистов.

Туризм. Агент берёт запрос «берлин, неделя, концерт techno», модель строит маршрут, бронирует билеты и гостиницу через API партнёров, рассылает электронные ваучеры. Выгода: полноценный консьерж без кол-центра.

Производство. Завод грузит телеметрию станков, K2 пишет код для предиктивного обслуживания и пушит его в систему контроля. Выгода: меньше простоя, экономия на внеплановых ремонтах.

EdTech. Платформа подсовывает K2 учебный план и прогресс студентов. Модель собирает микро-курсы и задачи, автоматически подгоняет сложность. Выгода: удержание аудитории и устойчивая подписка.

И что? Для бизнеса — открытый триллионник режет расходы на API и ускоряет запуск частных ассистентов. Для инвесторов — MuonClip доказывает, что триллионник можно обучить без каскада ребутов, значит маржа выше. Для рынка — Китай поднимает планку открытых моделей и добавляет давления на Big Tech.

🔥Сделка

💰Google занёс $2.4B — без сделки, просто за лицензию и пару инженеров

Chat GPT

🤖 Google заключает лицензионное соглашение с Windsurf на 2,4 млрд $, а CEO Varun Mohan и со-основатель Douglas Chen переходят в команду Gemini, чтобы развивать агентный автокод. Windsurf остаётся самостоятельной под временным CEO, обслуживает корпоративных клиентов и получает многолетние компенсации; лицензия неэксклюзивная, поэтому продукт можно развивать дальше.

До этого Windsurf почти продалась OpenAI за 3 млрд $, но сделка застопорилась: партнёрское соглашение OpenAI с Microsoft требовало открыть код Redmond, Windsurf просил исключение, Microsoft отказался, срок эксклюзивности истёк. В результате команда выбрала вариант с Google — меньшая сумма на балансе, зато свобода продукта и роли в крупной экосистеме.

Для OpenAI это ещё один сигнал, что тесная связка с Microsoft ограничивает гибкость в крупных сделках, а рынок инструментов для разработчиков смещается к лицензиям и точечным наймам вместо полного поглощения.

И что? Для бизнеса — модель «лицензия + ключевые люди» даёт деньги и контроль над продуктом одновременно. Для инвесторов — барьер входа в агентный код оценивается выше 2 млрд $, что поднимает цены на схожие стартапы. Для рынка — пауза в тандеме OpenAI-Microsoft открывает место для новых союзов, а Google укрепляет Gemini реальными технологиями.

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🚦 OpenAI отложила релиз модели с открытыми весами, сославшись на дополнительный safety-аудит. Изначально анонс обещал лето, теперь в календаре пусто.

И что? Стартапы с open-stack получают лишние недели без давления флагмана, а регуляторы видят: даже лидеры притормаживают, пока не уверены в защите данных.

🚗 Tesla вшивает ассистента Grok прямо в новую партию машин, прошивка для прежних прилетит OTA. Интеграция даёт голосовые подсказки, чат с бортовым API и быстрый поиск по мануалам.

И что? Маск замыкает водителей в собственной экосистеме, сокращая визиты к Siri и Android Auto, а дилеры получают новый upsell — «чат-пакет».

🤖 а ещё xAI признала, что всплеск токсичности Grok-3 вызвали «устаревшие инструкции» в датасете. Патч развернули за сутки, логи ошибок выложили публично.

И что? Публичный разбор багов становится нормой, чтобы удерживать корпоративное доверие.

🔧 а также Grok-4 перестал ссылаться на твиты Маска: системная подсказка обнуляет мнение создателя. Апдейт выкатили после жалоб, что бот цитирует босса при каждом вопросе.

И что? Меньше рисков идеологического уклона внутри продукта, и демонстрация, что bias чинят быстрее, чем пишут отчёты о bias.

📢 Meta покупает голосовой стартап PlayAI; команда переезжает под крыло Йохана Шалквика уже на следующей неделе. Фокус — быстрый слой синтеза речи для метаверс-аватаров и брендов без сторонних лицензий.

И что? Meta закрывает дыру в voice-стеке и ускоряет запуск собственных ассистентов, а фаундерам даёт экзит, не дожидаясь линейного роста пользовательской базы.

📱 Microsoft выложила Phi-4-mini-flash-reasoning — 4-миллиардную открытую модель под on-device решения. Работает локально и тянет сложные рассуждения на смартфонных NPU без облака.

И что? Производители гаджетов режут счета за API и получают офлайн-конфиденциальность, а разработчики могут вставить LLM в часы или дрон без подписки на Azure.

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

ПОДПИШИСЬ! ЭТО БЕСПЛАТНО

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До завтра.

Метью Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.

Учёные нашли, как ИИ ворует наше время: хуже социальных сетей