🌙 Тайная ночная жизнь MS Copilot

А в это время Минвойны США запустило свою GenAI-платформу, первым инструментом стал Google Gemini for Government

Что в выпуске?

☕️ Привет, это твой утренний ИИ-дайджест за 15 декабря.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

  • 🌙 Тайная ночная жизнь Microsoft Copilot

  • 🧬 Почему на онкотестах больше не заработаешь

  • 🧠 Ещё один топовый матконкурс Putnam взял ноутбук

И ещё +12 новостей - быстрых, как ИИ: GenAI.mil и Gemini в армии США, DOJ: сеть вывоза Nvidia H100/H200 в Китай и изъятия на $50M+, ЕС расследует Google из-за AI Overviews/AI Mode и контента, Meta готовит “Avocado” и может закрыть релиз, Microsoft вкладывает C$19B в Канаду и держит данные внутри страны, Anthropic+Accenture обучают 30k консультантов Claude, Shopify: Agentic Storefronts и SimGym, Cursor: визуальный редактор с автоправкой кода, Runway: GWM-1 world model для интерактивных сред, Google Labs Disco делает мини-аппы из вкладок, ElevenLabs приносит голосовые технологии в продукты Meta, TIME: “Architects of AI” Person of the Year 2025

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

Microsoft

Chat GPT

02:00 ночи, человек втыкает в телефон и пишет в Copilot не про Excel, а про здоровье, тревогу, отношения и “что со мной вообще происходит”. Утром тот же человек открывает Copilot на компе и уже просит черновик письма, план созвона и сводку по задаче. Microsoft впервые показала это не “ощущениями продакта”, а цифрами на десятках миллионов диалогов.

Что случилось Microsoft AI выпустили исследование по 37,5 млн обезличенных диалогов Copilot. Период - с 7 января по 25 сентября 2025, примерно по 144k разговоров в день, enterprise и учебные аккаунты выкинули. Разговоры размечались машинными классификаторами по теме и “зачем пришёл” (поиск, совет, создание и т.д.), без ручного чтения людьми (“eyes-off”). 

Что они увидели (самое интересное)

  • На мобильном здоровье доминирует всегда: любой час, любой месяц - люди используют телефон как круглосуточный “велнесс-компаньон”. 

  • “Попроси совет” растёт по году: Copilot всё чаще используют как источник руководства, а не как поисковик. 

  • Ночью вверх лезут религия/философия/экзистенциальщина. 

  • В феврале заметный всплеск разговоров про отношения вокруг Дня святого Валентина. 

  • Десктоп - это “рабочая смена”: в бизнес-часы наверху темы про работу и карьеру (и это отдельно подчеркнуто в выводах). 

  • По времени недели: программирование чаще всплывает в будни, игры - на выходных. 

Контекст рынка Все гоняются за “ассистентом следующего поколения”, а реальность простая: на телефоне ассистент уже превращается в личного советчика, местами в “псевдотерапию”, и это зона с максимальными рисками и максимальной липкостью. Дальше выиграют те, кто умеет контекст: устройство, время суток, тема, риск. И кто умеет безопасно работать с “здоровьем и жизнью”, а не только с “продуктивностью”. 

И что?

Для бизнеса: если ты делаешь ассистента или интерфейс поверх LLM - дизайн должен быть разный для мобилы и десктопа. На мобиле решает короткий совет, эмпатия, безопасность и эскалации. На десктопе - скорость, файлы, действия, интеграции. 

Для инвесторов: рост “советника” на мобиле означает спрос на safety-инфраструктуру (политики, детекторы риска, логирование, ограничители) и на продукты, которые удерживают ежедневные привычки, а не разовые запросы. 

Для людей: AI всё чаще будет рядом в личных темах. Это удобно и иногда реально помогает, но риск плохих советов в здоровье и психике становится не “теорией”, а массовой эксплуатацией. 

🚨 Нам 3.14здец

Продуктам, которые лезут в здоровье без жёсткой safety-обвязки - 9/10 - люди всё равно будут спрашивать ночью и на эмоциях - ставить детекторы риска, ограничения, корректные дисклеймеры и маршрутизацию к профессиональной помощи. 

“Корпоративным Copilot-клонам только про работу” - 7/10 - реальный рост и лояльность сидят в мобиле и личном - либо расширяешь сценарии и контроль рисков, либо остаёшься утилитой без привычки.

Microsoft

Chat GPT

Мужчине 58. Подозрение на рак лёгкого. Ему сделали биопсию, ткань на стекле, обычная окраска. Онкологу нужно понять: иммунка в опухоли “живая” или там пустыня, есть ли шанс на иммунотерапию и насколько агрессивно всё выглядит. А патолог в этот момент упирается в железную реальность: по стандартной стекляшке видно архитектуру опухоли, но чтобы нормально оценить иммунные маркеры и окружение, часто нужен отдельный дорогой анализ с кучей меток. Это деньги, реактивы, очередь, несколько дней. И пациент эти дни просто теряет. Они могут стать для него роковыми.

Что случилось: Microsoft открыла модель GigaTIME. Она берёт обычный цифровой скан стандартного слайда (дешёвый и массовый) и пытается “дорисовать” то, что обычно получают только дорогими иммунными сканами: где в опухоли сидят иммунные клетки, насколько их много, как они распределены вокруг опухоли. По сути, это попытка заменить часть дорогой лабораторной процедуры виртуальной оценкой на основе картинки, которая и так есть почти у всех больниц.

Фактура:

Обучали на парных данных Providence Health: обычные слайды + продвинутые иммунные сканы, суммарно около 40 млн клеточных примеров.

  • Проверяли на 14,000+ пациентах.

  • Нагенерили “виртуальную библиотеку” примерно из 300,000 детальных изображений по 24 типам рака.

  • Нашли 1,200+ паттернов: как иммунная активность связана со стадией и выживаемостью.

Контекст рынка: это заход в “виртуальные анализы”. Самая неприятная часть онкологии в том, что богатые клиники могут делать дорогие панели всем, а обычные - выборочно или вообще не могут. Если модель начинает вытаскивать часть “дорогого смысла” из дешёвого рутинного слайда, исследования и отбор пациентов под терапии можно масштабировать на архивы больниц, а не на бюджеты лабораторий.

И что?

Для бизнеса: патология-софт, клиники, CRO, фарма - можно быстрее и дешевле гонять исследования и стратификацию пациентов на уже существующих слайдах. Продуктовая точка - встройка в рабочее место патолога и отчёты для R&D.

Для инвесторов: деньги смещаются в digital pathology (сканирование, хранение, разметка) и модели поверх этих данных. Те, кто контролирует поток слайдов и качество пайплайна, становятся дороже.

Для людей: шанс получать больше информации быстрее и дешевле, особенно там, где продвинутые тесты недоступны. Но это сначала про research и доказательную базу, а не про “кнопка поставила диагноз”.

🚨 Нам 3.14здец:

Лабам, которые живут на дорогих иммунных панелях в исследованиях - 7/10 - часть задач уйдёт в виртуальные оценки - держать премиум на случаях, где нужна физическая проверка, и продавать валидацию.

Стартапам “биомаркеры на маленьких когортах” - 8/10 - большие игроки смогут быстро проверять гипотезы на сотнях тысяч виртуальных кейсов - усиливать клинические конечные точки и причинность, иначе будет больно.

Putnam

Chat GPT

Putnam - это ежегодная студенческая математика для тех, кому мало нормальной жизни. Идёт с 1938 года, участвуют бакалавры из США и Канады (иногда ещё Мексика в формулировках, но ядро - US/Canada). Формат простой: 12 задач, 2 сессии по 3 часа, максимум 120 баллов. 

И да, “типичный результат низкий” нужно говорить цифрами: в 2024 участвовали 3,988 человек из 477 вузов, средний балл был около 8/120, медиана - 2/120, а максимум по стране - 90/120. 

То есть если ты набрал 20+ - ты уже очень заметный человек. Если ты набрал 80+ - ты из другой лиги.

Что случилось: Nous Research выпустили и открыли Nomos 1 - reasoning-систему на 30B, и заявили 87/120 на Putnam 2025, с восемью задачами “в идеал”. По прошлогодней табличке соответствия “балл-место” такой результат был бы вторым среди ~4,000 участников. 

Кто такие Nous Research? Это небольшая американская open-source лаборатория/стартап, который делает и публикует модели и инструменты “в открытом виде”. Если ты видел в комьюнити Hermes - это их линейка. 

Как они решают задачи (и что за harness) У них не “один ответ от модели”. Они запускают процесс решения как конвейер:

  • несколько параллельных попыток решить задачу (условные “воркеры”),

  • самокритика и переписывание,

  • затем отбор: ответы сравниваются между собой по турнирной сетке, и выбирается лучший финальный вариант.

Вот этот “дирижёр”, который управляет попытками, самопроверкой, отбором и финальной подачей, они и называют reasoning harness. То есть это не модель, а код-оркестрация вокруг модели. Они его тоже открыли. 

Почему это важно (проверка на враньё) Они прогнали Qwen3 через тот же harness и те же условия - получилось 24/120. Вывод неприятный для любителей “у нас секретный агент”: обвязка помогает, но основной прирост сидит в том, как Nomos дообучали и чем кормили. 

Контекст рынка Это ещё один гвоздь в идею “топ-математика только у закрытых лабораторий”. Открытая модель среднего размера показывает уровень, который по человеческим меркам выглядит как элита на супержёстком экзамене. Дальше будет гонка не за параметрами, а за пост-тренингом, данными и честной проверкой reasoning.

И что?

Для бизнеса: если у тебя продукт, где важны строгие шаги и цена ошибки (инженерка, финмодели, комплаенс, R&D) - open-source reasoning можно собирать в своём контуре и не зависеть от чужих API.

Для инвесторов: ценность уезжает в post-training, датасеты и eval-инфраструктуру. “Мы сделали агента” без воспроизводимых метрик будет быстро дешеветь.

Для людей: образование и экзамены станут ещё хуже по честности. Но если учишься нормально, у тебя появляется разборщик решений уровня сильного матем-кружка практически бесплатно.

🚨 Нам 3.14здец

EdTech “продаём задачники и объяснялки” - 8/10 - модель решает и объясняет лучше контент-фермы - уходить в практику, проекты, контроль честности и навыки, которые проверяются делом.

Командам “мы reasoning через обвязку” - 7/10 - рынок начнёт требовать воспроизводимость - вкладываться в данные, обучение и оценку качества, а не в красивые пайплайны.

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🪖 GenAI.mil: Минобороны США запустило свою GenAI-платформу, первым инструментом стал Google Gemini for Government. И что? Frontier-модели официально заходят в гос-контур “всеми руками”, и это запускает волну закупок, стандартов и конкуренции за доступ к гос-данным и юзерам. 

Как применить: если ты продаёшь AI в regulated-сегменты - срочно подтягивать FedRAMP/гос-комплаенс, закрытые контуры, аудит и “не обучаемся на ваших данных” как продуктовую фичу.

🧱 DOJ: двух людей задержали за сеть контрабанды Nvidia H100/H200 в Китай, в деле фигурирует изъятие “over $50M” в GPU и кэше. И что? Серый рынок чипов будут душить ещё жёстче, а любой бизнес рядом с поставками/перепродажей GPU попадёт под лупу. 

Как применить: проверь цепочку поставок и конечных пользователей, усиливай KYC/AML на железо и “кто куда везёт”, иначе можно внезапно стать персонажем пресс-релиза DOJ.

⚖️ ЕС: Еврокомиссия открыла антимонопольное расследование против Google из-за использования контента сайтов и YouTube для AI Overviews и AI Mode. И что? В Европе начинается большая драка “платите за контент”, и это может поменять экономику AI-поиска и условия для издателей. 

Как применить: если у тебя медиа/контент - готовь стратегию лицензирования и технастроек (контроль индексации/условия доступа), параллельно строй прямые каналы, чтобы не зависеть от трафика.

🥑 Meta “Avocado”: по сообщениям, Meta готовит новый frontier-модельный релиз на Q1 2026, и он может быть закрытым, в отличие от прошлых open-weights. И что? Большие игроки всё чаще будут закрывать “самое вкусное”, когда появляется реальная монетизация и риск. 

Как применить: если твой продукт сидит на open-weights как на кислороде - закладывай план B: мультивендорность, миграции, своя тонкая настройка, свой датасет.

💰 Microsoft: объявили C$19B инвестиций в AI/облако в Канаде до 2027 и план “держать канадские данные в Канаде”. И что? Суверенность данных становится базовым требованием, и крупняк продаёт это как пакет “инфра + безопасность + локальная обработка”. 

Как применить: если ты продаёшь в госсектор/финансы/медицину - делай локальные контуры, резидентность данных и понятные обещания по обработке.

🧑‍💼 Anthropic + Accenture: многолетнее партнёрство, обучение примерно 30,000 консультантов работе с Claude, плюс масштабирование Claude Code внутри Accenture. И что? “Пилоты” будут проталкивать в прод быстрее, потому что у Accenture сильнейшая машина продаж и внедрений. 

Как применить: если ты энтерпрайз-вендор - готовься к конкуренции “упакованных” AI-решений от интеграторов и делай партнёрскую стратегию заранее.

🛒 Shopify Winter ’26: Agentic Storefronts (товары начинают показываться внутри AI-чатов типа ChatGPT/Copilot/Perplexity) + SimGym (симуляция поведения покупателей). И что? Коммерция переезжает в AI-каналы, и витрина теперь не только сайт, но и “как агент видит твой каталог”. 

Как применить: проверь фиды, атрибуты, наличие, политику цен и брендинг так, как это читают агенты. Это новый SEO, только больнее.

🧩 Cursor: выпустили визуальный редактор, где ты двигаешь интерфейс drag-and-drop, а агенты обновляют код под изменения. И что? Фронтенд ещё сильнее превращается в “задай намерение + проверь качество”, а скорость сборки интерфейсов вырастет. 

Как применить: командам разработки - пересобрать процесс ревью и тестирования, потому что “быстро нагенерили UI” без QA станет источником багов и техдолга.

🎮 Runway: показали GWM-1, “general world model”, который в реальном времени генерит и позволяет управлять интерактивной средой (actions, камера и т.д.). И что? Генеративка уходит из “сделай ролик” в “сделай симулятор”, а там уже игры, обучение агентов и роботы. 

Как применить: если ты делаешь продукты для обучения/симуляций - смотри на world models как на новый слой платформы, а не как на “ещё одну видеомодель”.

🕺 Google Labs Disco: экспериментальный браузер, который с Gemini 3 превращает открытые вкладки в кастомные мини-приложения (GenTabs). И что? Браузер начинает конкурировать с “поиском ссылками” и превращается в среду выполнения задач. 

Как применить: для продуктовых команд - думать про “task-first” интерфейсы и то, как ваш контент и сервисы могут становиться частью таких мини-аппов.

🎙️ ElevenLabs + Meta: партнёрство по аудио/голосу для Instagram, Horizon и прочего, включая дубляж Reels и голоса персонажей. И что? Массовая локализация и “голос как фича” станут стандартом прямо внутри соцсетей. 

Как применить: контент-командам - тестировать дубляж и мультиязычность как рост охватов, пока это встроено и дешево.

🧠 TIME: “Architects of AI” стали Person of the Year 2025 (в подборке лидеры крупнейших AI-игроков). И что? Тема окончательно становится массовой политикой и культурой, давление регуляторов и общества будет расти вместе с вниманием. 

Как применить: если у тебя AI-продукт - готовь публичную позицию по рискам, прозрачности и безопасности, иначе тебя будут обсуждать без тебя.

🚨 Нам 3.14здец (сводка по рискам):

Контентным сайтам и медиа - 9/10 - AI-выдача съедает трафик и деньги - строить прямые каналы, лицензирование и продукты, где ценность не в “клике из поиска”. 

Бизнесу на “серых GPU” - 10/10 - экспортный контроль и расследования будут только жёстче - чистить цепочки, комплаенс и документирование поставок.

BIPI AI - СООБЩЕСТВО!

Вступить в сообщество BIPI AI

Если ты дочитал до этого места, значит ты уже чувствуешь, куда катится ИИ и насколько быстро всё меняется, а в такой момент важнее всего оказаться в правильной компании людей.

Поэтому я запустил BIPIAI — сообщество фаундеров и топ-специалистов, которые хотят пройти эпоху ИИ на полной скорости в роли пилота, а не пассажира: внутри практика, разборы реальных бизнес-кейсов, рабочие пайплайны, созвоны, где участники показывают, как они вшивают модели в продажи, маркетинг и продукт, и клуб единомышленников, с которыми можно одновременно понимать картину целиком и собирать свои решения под новую реальность. Нас уже 80 + участников внутри из 15 стран. 

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До завтра.
Дмитрий Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.