- Big Pictrure AI
- Posts
- 🔬 Прорыв от MIT и Google: их ИИ создаёт первые квантовые материалы, которых нет в природе
🔬 Прорыв от MIT и Google: их ИИ создаёт первые квантовые материалы, которых нет в природе
А в это время Абу-Даби идёт к статусу «полностью AI-native правительства» к 2027

та
Что в выпуске?
☕️ Привет, это твой дневной ИИ-дайджест за 29 сентября.
Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать
🔬 Кому нужны «квант-материалы» и как их начинают генерировать по правилам, чтобы быстрее дойти до реальных образцов?
🦅 Что меняется на рынке, когда Alibaba отдаёт перевод, визуалку, модерацию и кодинг одним пакетом?
🧠 Как выбрать LLM по людям и языкам, а не по усреднённому баллу — и сразу сэкономить на ретраях и поддержке?
🎓 Что показал Google DORA: 90% разработчиков уже с ассистентами — где реальная выгода и как её закрепить?
И ещё +11 новостей — быстрых, как ИИ: Microsoft добавил Claude в 365 Copilot, SAP и OpenAI готовят OpenAI for Germany (старт в 2026), Microsoft показал микроканальное охлаждение чипов с до 3× лучшим отводом тепла, Suno выпустил v5 музыкогенерации, Cloudflare открыл VibeSDK для «vibe coding», OpenAI+Oracle+SoftBank объявили 5 площадок Stargate на пути к 10 ГВт, Google Labs запустил Mixboard с Nano Banana, Британия вернула £480M с AI-акселератором фрода, Cohere привлёк $100M при оценке ~$7B, Абу-Даби строит AI-native правительство к 2027 (200+ решений), Маск прошёлся по Anthropic в X.
⚠️ ДИСКЛЕЙМЕР
ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.
ПОГНАЛИ!
MIT

Chat GPT
Материалы — штука понятная: машины делают из стали и алюминия, стаканчики — из переработанной бумаги, айфоны прыгали с титана на алюминий, процессоры — из кремния. Параллельно весь мир ковыряет новые: твёрдотельные батареи и электролиты для безопасности и плотности энергии, перовскиты для солнечных панелей, GaN/SiC для силовой электроники, катализаторы для водорода и хранения энергии. Делают это тремя путями: комбинаторный синтез «тысячи образцов за раз», вычислительные прогоны на суперкомпьютерах (DFT, базы типа Materials Project), и ИИ-модели, которые уже нагенерили миллионы кристаллов (вроде GNoME у DeepMind). Зачем? Дешевле хранить энергию, эффективнее превращать свет в электричество, упростить электронику.
Теперь — «квантовые материалы». Это кристаллы со специальным узором решётки, из-за которого электроны ведут себя необычно: появляются редкие типы магнетизма, сверхпроводимость, эффекты для квбитов и сверхточных датчиков. Природа такими почти не делится; искать «вручную» — годы. Поэтому заметные сдвиги получаются, только когда сужаешь поиск хитрыми правилами.
MIT выкатил SCIGEN — надстройку к диффузионным моделям, которая заставляет ИИ соблюдать геометрические правила прямо во время генерации. Не «штампуем всё подряд и потом фильтруем», а сразу рисуем кристаллы с нужными узорами, связанными с квант-свойствами. Фактура: сгенерили ~10 млн кандидатов, ~1 млн прошли прескрининг стабильности; для 26 000 сделали тяжёлые квант-расчёты, у ~41% нашли нужный магнитный порядок. И главное — в лаборатории реально собрали два новых соединения, TiPdBi и TiPbSb, их поведение совпало с предсказаниями. DeepMind помогал с фреймворком. Смысл простой: SCIGEN убирает физически невозможный мусор и переносит работу из «экрана» в «пробирку» быстрее.
И что?
Для бизнеса: лаборатории и приборостроение по квант-направлению получают shortlist по свойствам, а не мешок «просто стабильных» кристаллов — поток 10M → 1M → 26k с магнитным порядком у 41% снижает холостые симуляции и пробы на порядок; действие: фиксируйте целевые решётки (кагоме/Lieb/архимедовы), гоните генерацию с правилами, резервируйте DFT-квоты и синтезируйте top-N.
Для инвесторов: риск ниже — есть лабораторная валидация (два новых соединения с совпадением предсказаний), понятная метрика hit-rate по конкретным классам решёток; ставка — на команды с полным контуром «геометрические правила → генерация → DFT → синтез» и портфелем IP на семействa квант-материалов (спинтроника, квант-сенсоры, магнитная память).
Для людей: быстрее дойдут прикладные штуки именно из квант-материалов — сверхчувствительные датчики (магнито- и терагерц-диапазон), энергоэффективная спинтронная память, элементы для устойчивых кубитов; ожидание между идеей и рабочим образцом сокращается с лет до кварталов.
🚨 Нам 3.14здец
Группы «ищем руками» — 8/10 — вас обгонит воронка 10M→1M→26k→синтез; что делать: ставить геометрические ограничения на генерацию и автоматизировать DFT+синтез.
Генеративки «без физики» — 7/10 — нереализуемые решётки больше никому не нужны; что делать: вшивать правила решёток и фильтры реализуемости прямо в генератор.
China AI

Aiibaba
У любой компании сегодня два конвейера: контент и обучение. По утрам прямые эфиры и вебинары, к обеду — пачка шортов и клипов, к вечеру — обновление базы знаний и онбординг для новых людей. Из задач — переозвучить лекцию на испанский и арабский, нагенерить сабы, вычистить токсик, размечать скринкасты, выдать автотезисы и тесты, собрать курс «вчера на завтра». Тем временем продукт выкатывает апдейт — половина инструкции устарела, карточки и подсказки надо пересобрать. Контент летит сотнями единиц в день, знания протухают каждую неделю, а людей жалко — монтажёр горит, методист захлебнулся правками, саппорт тонет.
Логичный ответ — отдать рутинистику нейросетям. Но зоопарк убивает темп и бюджет: один сервис слушает речь, другой переводит, третий озвучивает, четвёртый понимает картинки, пятый модерирует, шестой помогает кодом. Разные ключи, разные задержки, разные счета, интеграции тянутся неделями, юристы правят DPA, а в пике всё разваливается из-за лимитов. В итоге не конвейер, а свалка.
На этой картинке и въезжает Alibaba с Qwen3 — пакет из шести моделей, который закрывает весь конвейер одной рукой и меняет экономику такого цеха уже на следующем спринте.
Alibaba выкатывает Qwen3 как единый комплект под конвейер «контент + обучение». LiveTranslate-Flash закрывает синхронный голосовой перевод в звонках и на стримах; по техотчёту Omni первый аудиопакет отдаёт за ~234 мс, речь понимает на 19 языках и генерирует на 10 — то, что нужно, чтобы за вечер собирать дубляжи и субтитры без студии. Qwen-VL берёт на себя поиск по видео и скринам, OCR и таймкоды; из коробки — длинные ролики, точная разметка и интерфейсные скриншоты. Guard — модерация UGC до публикации. Coder — автотесты и фиксы прямо в CI. А сверху — Qwen-Max на >1 трлн параметров для агентных сценариев: собрать тезисы, план урока, чек-листы и вопросы для квиза на лету.
Матчасть. Qwen3-Max — >1T параметров, фокус на кодинг и «агентов»; компания параллельно наращивает капексы: 380 млрд юаней на AI-инфраструктуру за три года, что объясняет темп релизов. По свежим бенчмаркам Max и Omni показывают сильные результаты на Tau2-Bench, VoiceBench и др., местами обгоняя западные закрытые модели. Публичных цен за минуту/запрос пока нет — считаем экономику после прайса.
Кому больно и почему — по цехам, с цифрами.
Перевод и дубляж: DeepL — $185,2M выручки в 2024 и >100k B2B-клиентов; LiveTranslate-Flash + Omni вшиваются в звонки и студии и уводят задачи локализации ближе к продакшену. Otter.ai — >25M пользователей и $100M ARR — теряет уникальность «встреч» там, где перевод и сабы уезжают в платформу.
Речь/ASR-API: AssemblyAI — $10,4M выручки ’24 — рискует по realtime-кейсам, если Omni/LiveTranslate стабильно держат задержку и качество на многоязычии.
Видео-поиск/понимание: Twelve Labs — enterprise-ниша с дорогими пайплайнами; если Qwen-VL даёт сравнимое качество и длинный контекст, часть M&E-заказов уйдёт в Qwen-стек.
Модерация: Hive — один из крупных провайдеров, работает с социальными платформами; появление Guard как «встроенного фильтра» в том же стеке, где крутится контент, бьёт по внешним модераторам.
Код-ассисты: GitHub Copilot — 20M пользователей all-time — держит монополию в IDE, но Coder + Max «в CI» отжимают рутину на уровне пайплайна, где платёжку контролирует инфраструктурная команда.
Почему сейчас. Alibaba официально смещает фокус в AI и поддерживает это деньгами и релиз-каденсом: «тяжёлый» Max, мультимодальный Omni, VL для визуалки и сервисы вокруг. Это ровно под рынок, где контент нужно клепать сотнями единиц в день, а знания тухнут еженедельно. Китайский темп релизов закрывает дыру между «нужно вчера» и «подождите до квартального апдейта».
И что?
Для бизнеса: один стек закрывает перевод в прямом эфире, автосабы, поиск по видео, модерацию и код-рутину. Меньше интеграций, быстрее релизы, меньше чеков на зоопарк.
Для инвесторов: давление на узкие SaaS с маржой на токенах; пакетные поставщики около фронтира забирают LTV благодаря cross-sell внутри стека.
Для людей: курсы, созвоны и обучение сразу на своём языке; поиск внутри видео по смыслу, а не по словам.
🚨 Нам 3.14здец
Узкие SaaS по дубляжу/сабам/модерации — 8/10 — функции уезжают «в комплект» Qwen; что делать: уход в вертикали, он-прем и регуляторные ниши.
Код-ассисты «по подписке» — 7/10 — CI-боты закрывают тесты/рефакторинг на уровне пайплайна; что делать: продавать глубину (безопасность, комплаенс, доменные плагины) или сливаться.
AI зоопарк

Scale
Нейросетей уже дофига. GPT, Claude, Gemini, Qwen, DeepSeek, Mixtral, локальные — интерфейсы одинаковые, обещания одинаковые, а тебе нужна та, что решит конкретные задачи. Есть два пути. Либо тестить каждую на своих сценариях, жечь спринты и бюджет. Либо опереться на чужие оценки: бенчмарки и лидерборды.
Как устроены оценки. Первая ветка — синтетика: готовые наборы вопросов и кода. Там любят MMLU, GSM8K, HumanEval, HellaSwag, ARC и прочие «лабораторные» измерители. Удобно для sanity-check, но это лаборатория: один балл не говорит, как модель держит тон на испанском, что понимает джун, и где она сыпется на реальных регламентах. Вторая ветка — арены человеческих предпочтений. Самая известная — LMSYS Chatbot Arena: два ответа «вслепую», люди голосуют, копится Elo. Ближе к жизни, но без разрезов по аудитории это средняя температура. Кто голосовал, на каком языке, какой опыт — не видно. И да, под такую арену легко подкрутить стиль: длиннее, мягче, с markdown — и уже «лучше».
Теперь бизнес. Представь маркетплейс в Испании, Мексике и ОАЭ. Саппорт для покупателей и селлеров, обучение мерчантов, поиск по базе. Берёшь «победителя» из таблицы — и ловишь реальность. Испанский звучит сухо и канцелярски, арабский путает даты и термины, джунам по SQL приезжают академические полотнища. Эскалаций больше, NPS вниз, ретраев море. Один общий рейтинг — шляпа, когда у тебя три языка и четыре профиля пользователей.
Вот сюда и заходит Scale с SEAL Showdown. Это лидерборды по реальным предпочтениям с разметкой по людям. Их контрибьюторы в ~100 странах и ~70 языках сравнивают фронтир-модели «бок о бок» в Playground, голосование добровольное, сырые данные складируют на 60 дней, чтобы не крутили. На выходе — не «топ-1 вообще», а срезы: язык, возраст, образование (дальше — профессии). Видно, какая модель понятнее новичкам, какая аккуратнее для юристов 45+, где испанский и арабский совпадают с английским, а где разъезжаются. Это инструмент закупки и роутинга, а не витринный кубок.
Как применять. Берёшь свои когорты — испанский онбординг, арабский юрпоток, техподдержка для джунов — и под каждую выбираешь топ-2 из Showdown. Делаешь мульти-модельный роутинг, в SLA фиксируешь «полезно с первой попытки», время до решения и жалобы на тон по каждой когорте. Синтетику держишь как санитарный минимум, но решение принимаешь по предпочтениям реальных людей, похожих на твоих пользователей.
И что?
Для бизнеса: меньше переделок и жалоб, выше «с первой попытки», закупка под аудитории, а не под усреднённый балл.
Для инвесторов: новый дата-актив — предпочтения по языкам и демографии; монетизация через вендоров и due diligence сделок.
Для людей: ответы звучат так, как им удобно — по стилю, по языку, по уровню.
🚨 Нам 3.14здец
Маркетинг «мы №1 в общем рейтинге» — 7/10 — теряет доверие у enterprise, когортные метрики рвут ширму; что делать: публиковать срезы и давать SLA по кластерам.
Команды «одна модель на всех» — 6/10 — тонут в ретраях и падении NPS; что делать: вводить когортный роутинг и выбирать модели под языки и роли.

Жизнь разработчика поменялась. Раньше всё шло по прямой: ТЗ, ручной CRUD, миграции, поиск примеров, тесты с нуля, код-ревью, релиз. Теперь рядом живут ассистенты — Copilot, Cursor/JetBrains AI, Claude, GPT-4o, Gemini, Amazon Q, Codeium. Они пишут болванки и миграции, собирают тест-рыбу, формируют PR-резюме, объясняют чужой код, подсказывают SQL и YAML, вытаскивают куски из внутренней базы знаний. Снаружи выглядит как приговор профессии: «автокод всё съест». На практике картинка сложнее.
Google в свежем DORA-отчёте проверил реальность. Почти 5 000 специалистов, медиана использования — около двух часов в день, охват — 90%. При этом 30% говорят: доверия мало или вовсе нет. И всё равно 80% фиксируют ускорение, 59% — улучшение качества кода. Что это значит в жизни команды: ассистент делает черновик и обвязку, дальше статанализ, тесты, ревью, merge проходит через человека. Массовое использование уживается со скепсисом, потому что инструмент вмонтирован в процесс, а не заменяет его.
Чтобы это давало стабильную пользу, Google описал DORA AI Capabilities Model — семь практик вокруг ассистентов. Ответственность за финальное решение у людей. Выгода появляется там, где есть системный контур, а не красивый демо-ролик.
7 правил, чтобы ИИ давал пользу каждый день (и как именно)
— Правила и ответственный: фиксируем где можно/нельзя, кто решает спорные случаи → меньше стопов и согласований → задачи проходят без «позовите юриста».
— Порядок в материалах: у документов есть владельцы, график обновления, метки свежести → ИИ опирается на актуальные данные → меньше переделок и конфликтов «устарело».
— Контекст компании: ИИ подключён к вашим документам и даёт ответы со ссылками на источник → меньше фантазий → текст сразу годится в работу.
— Малые изменения и быстрый откат: правки маленькими порциями, кнопка «вернуть» за минуты → промахи чинятся быстро → команда не простаивает.
— Встроенность в рабочие инструменты: подсказки и автопроверки прямо там, где вы работаете → меньше переключений и копипаста → время уходит на результат, а не на перетаскивание.
— Метрики на дашборде: видно «полезно с первой попытки», время до результата, долю переделок, время исправления → каждый день понятно, что ускорять и что закрывать.
— Human-gate на финал: человек утверждает итог, след ИИ виден в правках → брак не уходит наружу → меньше жалоб и откатов.
Смысл: ИИ ускоряет, порядок держит качество.
И что?
Для бизнеса: переносим ассистентов из «идеек в IDE» в процесс — метрики и quality-gates в CI/CD, человеческий gate на merge, доступ к внутрянке, ответственность по ролям.
Для инвесторов: ценность у тех, кто превращает часы ассистента в предсказуемый lead time и меньше фейлов релиза.
Для людей: рутина уходит в генерацию и обвязку, время освобождается под архитектуру и решение задач.
🚨 Нам 3.14здец
Команды без автотестов и ревью — 8/10: ускоренная поставка сырца и регрессии в проде. Что делать: жёсткие quality-gates, покрытие, запрет merge без проверок.
Менеджмент со «строками кода» — 7/10: метрика разваливается. Что делать: перейти на DORA-метрики — lead time, change failure rate, time to restore плюс «полезно с первой попытки».
БЫСТРЫЕ КАК ИИ НОВОСТИ
Что еще случилось за прошлые 24 часа
🛡️ Британия отчиталась: ИИ-инструмент Fraud Risk Assessment Accelerator помог вернуть £480 млн за год (апрель 2024–апрель 2025). Треть суммы — ковидные схемы, которые раньше ускользали. И что? Меньше утечек бюджета и кейсов «растворили компанию — списали долг», дальше ещё и экспорт технологии в другие страны.
🧰 Microsoft впустил Anthropic в 365 Copilot: Claude Sonnet 4 и Opus 4.1 теперь доступны в Researcher и Copilot Studio. И что? Это первый официальный выбор модели вне OpenAI внутри 365 — можно миксовать движки под задачу (таблицы, презентации, агенты). Плюс: гибкость закупок и снижение рисков «зависимости от одного вендора».
🏛️ Абу-Даби идёт к статусу «полностью AI-native правительства» к 2027: 200+ AI-решений, 100% суверенного облака, бюджет ~AED13 млрд. И что? Выгода для жителей — быстрее услуги (единый ERP-хребет, TAMM 3.0), для экономики — +AED24 млрд к ВВП и тысячи рабочих мест.
🎵 Suno выкатил v5: компания заявляет «самую мощную» модель музыкогенерации, улучшенные вокалы, миксы и контроль. И что? Практика — быстрее проход к коммерческому качеству треков и джинглов, меньше ручной пост-обработки. Для создателей — экономия времени и бюджета на продакшен.
💧 Microsoft показал микро-жидкостное охлаждение кристаллов: жидкость по каналам, протравленным прямо в кремнии, до 3× лучшая теплотрасса и до −65% к пикам температуры. Бонус — плотнее стойки и меньше затрат на «холод», что критично под рост ИИ-нагрузок.
💸 Cohere привлёк $100 млн, оценка ~$7 млрд; в фокусе — enterprise-платформа North и модели Command A, плюс партнёрство с AMD. И что? Для корпоративных ИТ — ещё один «безопасный» поставщик с внятным прайсингом и контролем данных, для рынка — давление на мульти-вендорные стратегии.
🧩 Cloudflare открыл VibeSDK: «виб-кодинг» в один клик — свой AI-генератор приложений с песочницей, AI Gateway и деплоем на Workers. И что? Можно быстро поднять внутренний «App Builder» без боли с рантаймом и безопасностью, а код вывозить в свой репозиторий.
🗂️ Google Labs запустил Mixboard: доска-конструктор идей с текстовыми промптами и картинками, редактирование через модель Nano Banana. И что? Плюс: быстрые варианты концептов, «more like this» и правки на естественном языке — удобно для маркетинга, дизайна и продукт-брейнштормов.
⚡ OpenAI, Oracle и SoftBank объявили 5 новых площадок Stargate (TX, NM, OH и ещё один сайт на Среднем Западе): цель — довести мощность кластера к 10 ГВт, уже подтверждено ~7 ГВт и >$400 млрд инвестиций. И что? Меньше «дефицита вычислений» для продуктов и исследований.
🗯️ Маск уколол Anthropic в X: «winning was never in the set of possible outcomes». И что? Факт сам по себе не меняет бенчмарки, но отражает эскалацию конкуренции и давления на юнит-экономику «ассистентов» в enterprise. Для закупок — дополнительный аргумент в пользу мульти-модельных стеков.
🛡️ SAP и OpenAI запустят «OpenAI for Germany» — суверенную платформу для госслужащих на базе Delos Cloud (Azure-стек), старт в 2026. И что? ИИ-агенты и автоматизация документооборота внутри регуляторных рамок Германии; меньше бумажной рутины, больше времени «на людей».
Будь на связи
Один дайджест вместо сотни каналов
Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.
На сегодня это все
Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.
До завтра.
Дмитрий Грин
P.S.
Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.