• Big Pictrure AI
  • Posts
  • 🔬 Прорыв от MIT и Google: их ИИ создаёт первые квантовые материалы, которых нет в природе

🔬 Прорыв от MIT и Google: их ИИ создаёт первые квантовые материалы, которых нет в природе

А в это время Абу-Даби идёт к статусу «полностью AI-native правительства» к 2027

та

Что в выпуске?

☕️ Привет, это твой дневной ИИ-дайджест за 29 сентября.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

  • 🔬 Кому нужны «квант-материалы» и как их начинают генерировать по правилам, чтобы быстрее дойти до реальных образцов?

  • 🦅 Что меняется на рынке, когда Alibaba отдаёт перевод, визуалку, модерацию и кодинг одним пакетом?

  • 🧠 Как выбрать LLM по людям и языкам, а не по усреднённому баллу — и сразу сэкономить на ретраях и поддержке?

  • 🎓 Что показал Google DORA: 90% разработчиков уже с ассистентами — где реальная выгода и как её закрепить?

И ещё +11 новостей — быстрых, как ИИ: Microsoft добавил Claude в 365 Copilot, SAP и OpenAI готовят OpenAI for Germany (старт в 2026), Microsoft показал микроканальное охлаждение чипов с до 3× лучшим отводом тепла, Suno выпустил v5 музыкогенерации, Cloudflare открыл VibeSDK для «vibe coding», OpenAI+Oracle+SoftBank объявили 5 площадок Stargate на пути к 10 ГВт, Google Labs запустил Mixboard с Nano Banana, Британия вернула £480M с AI-акселератором фрода, Cohere привлёк $100M при оценке ~$7B, Абу-Даби строит AI-native правительство к 2027 (200+ решений), Маск прошёлся по Anthropic в X.

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

MIT

Chat GPT

Материалы — штука понятная: машины делают из стали и алюминия, стаканчики — из переработанной бумаги, айфоны прыгали с титана на алюминий, процессоры — из кремния. Параллельно весь мир ковыряет новые: твёрдотельные батареи и электролиты для безопасности и плотности энергии, перовскиты для солнечных панелей, GaN/SiC для силовой электроники, катализаторы для водорода и хранения энергии. Делают это тремя путями: комбинаторный синтез «тысячи образцов за раз», вычислительные прогоны на суперкомпьютерах (DFT, базы типа Materials Project), и ИИ-модели, которые уже нагенерили миллионы кристаллов (вроде GNoME у DeepMind). Зачем? Дешевле хранить энергию, эффективнее превращать свет в электричество, упростить электронику. 

Теперь — «квантовые материалы». Это кристаллы со специальным узором решётки, из-за которого электроны ведут себя необычно: появляются редкие типы магнетизма, сверхпроводимость, эффекты для квбитов и сверхточных датчиков. Природа такими почти не делится; искать «вручную» — годы. Поэтому заметные сдвиги получаются, только когда сужаешь поиск хитрыми правилами. 

MIT выкатил SCIGEN — надстройку к диффузионным моделям, которая заставляет ИИ соблюдать геометрические правила прямо во время генерации. Не «штампуем всё подряд и потом фильтруем», а сразу рисуем кристаллы с нужными узорами, связанными с квант-свойствами. Фактура: сгенерили ~10 млн кандидатов, ~1 млн прошли прескрининг стабильности; для 26 000 сделали тяжёлые квант-расчёты, у ~41% нашли нужный магнитный порядок. И главное — в лаборатории реально собрали два новых соединения, TiPdBi и TiPbSb, их поведение совпало с предсказаниями. DeepMind помогал с фреймворком. Смысл простой: SCIGEN убирает физически невозможный мусор и переносит работу из «экрана» в «пробирку» быстрее. 

И что?

Для бизнеса: лаборатории и приборостроение по квант-направлению получают shortlist по свойствам, а не мешок «просто стабильных» кристаллов — поток 10M → 1M → 26k с магнитным порядком у 41% снижает холостые симуляции и пробы на порядок; действие: фиксируйте целевые решётки (кагоме/Lieb/архимедовы), гоните генерацию с правилами, резервируйте DFT-квоты и синтезируйте top-N.

Для инвесторов: риск ниже — есть лабораторная валидация (два новых соединения с совпадением предсказаний), понятная метрика hit-rate по конкретным классам решёток; ставка — на команды с полным контуром «геометрические правила → генерация → DFT → синтез» и портфелем IP на семействa квант-материалов (спинтроника, квант-сенсоры, магнитная память).

Для людей: быстрее дойдут прикладные штуки именно из квант-материалов — сверхчувствительные датчики (магнито- и терагерц-диапазон), энергоэффективная спинтронная память, элементы для устойчивых кубитов; ожидание между идеей и рабочим образцом сокращается с лет до кварталов.

🚨 Нам 3.14здец

Группы «ищем руками» — 8/10 — вас обгонит воронка 10M→1M→26k→синтез; что делать: ставить геометрические ограничения на генерацию и автоматизировать DFT+синтез.

Генеративки «без физики» — 7/10 — нереализуемые решётки больше никому не нужны; что делать: вшивать правила решёток и фильтры реализуемости прямо в генератор.

China AI

Aiibaba

У любой компании сегодня два конвейера: контент и обучение. По утрам прямые эфиры и вебинары, к обеду — пачка шортов и клипов, к вечеру — обновление базы знаний и онбординг для новых людей. Из задач — переозвучить лекцию на испанский и арабский, нагенерить сабы, вычистить токсик, размечать скринкасты, выдать автотезисы и тесты, собрать курс «вчера на завтра». Тем временем продукт выкатывает апдейт — половина инструкции устарела, карточки и подсказки надо пересобрать. Контент летит сотнями единиц в день, знания протухают каждую неделю, а людей жалко — монтажёр горит, методист захлебнулся правками, саппорт тонет.

Логичный ответ — отдать рутинистику нейросетям. Но зоопарк убивает темп и бюджет: один сервис слушает речь, другой переводит, третий озвучивает, четвёртый понимает картинки, пятый модерирует, шестой помогает кодом. Разные ключи, разные задержки, разные счета, интеграции тянутся неделями, юристы правят DPA, а в пике всё разваливается из-за лимитов. В итоге не конвейер, а свалка.

На этой картинке и въезжает Alibaba с Qwen3 — пакет из шести моделей, который закрывает весь конвейер одной рукой и меняет экономику такого цеха уже на следующем спринте.

Alibaba выкатывает Qwen3 как единый комплект под конвейер «контент + обучение». LiveTranslate-Flash закрывает синхронный голосовой перевод в звонках и на стримах; по техотчёту Omni первый аудиопакет отдаёт за ~234 мс, речь понимает на 19 языках и генерирует на 10 — то, что нужно, чтобы за вечер собирать дубляжи и субтитры без студии. Qwen-VL берёт на себя поиск по видео и скринам, OCR и таймкоды; из коробки — длинные ролики, точная разметка и интерфейсные скриншоты. Guard — модерация UGC до публикации. Coder — автотесты и фиксы прямо в CI. А сверху — Qwen-Max на >1 трлн параметров для агентных сценариев: собрать тезисы, план урока, чек-листы и вопросы для квиза на лету. 

Матчасть. Qwen3-Max — >1T параметров, фокус на кодинг и «агентов»; компания параллельно наращивает капексы: 380 млрд юаней на AI-инфраструктуру за три года, что объясняет темп релизов. По свежим бенчмаркам Max и Omni показывают сильные результаты на Tau2-Bench, VoiceBench и др., местами обгоняя западные закрытые модели. Публичных цен за минуту/запрос пока нет — считаем экономику после прайса. 

Кому больно и почему — по цехам, с цифрами.

Перевод и дубляж: DeepL — $185,2M выручки в 2024 и >100k B2B-клиентов; LiveTranslate-Flash + Omni вшиваются в звонки и студии и уводят задачи локализации ближе к продакшену. Otter.ai — >25M пользователей и $100M ARR — теряет уникальность «встреч» там, где перевод и сабы уезжают в платформу. 

Речь/ASR-API: AssemblyAI — $10,4M выручки ’24 — рискует по realtime-кейсам, если Omni/LiveTranslate стабильно держат задержку и качество на многоязычии. 

Видео-поиск/понимание: Twelve Labs — enterprise-ниша с дорогими пайплайнами; если Qwen-VL даёт сравнимое качество и длинный контекст, часть M&E-заказов уйдёт в Qwen-стек. 

Модерация: Hive — один из крупных провайдеров, работает с социальными платформами; появление Guard как «встроенного фильтра» в том же стеке, где крутится контент, бьёт по внешним модераторам. 

Код-ассисты: GitHub Copilot — 20M пользователей all-time — держит монополию в IDE, но Coder + Max «в CI» отжимают рутину на уровне пайплайна, где платёжку контролирует инфраструктурная команда. 

Почему сейчас. Alibaba официально смещает фокус в AI и поддерживает это деньгами и релиз-каденсом: «тяжёлый» Max, мультимодальный Omni, VL для визуалки и сервисы вокруг. Это ровно под рынок, где контент нужно клепать сотнями единиц в день, а знания тухнут еженедельно. Китайский темп релизов закрывает дыру между «нужно вчера» и «подождите до квартального апдейта». 

И что?

Для бизнеса: один стек закрывает перевод в прямом эфире, автосабы, поиск по видео, модерацию и код-рутину. Меньше интеграций, быстрее релизы, меньше чеков на зоопарк.

Для инвесторов: давление на узкие SaaS с маржой на токенах; пакетные поставщики около фронтира забирают LTV благодаря cross-sell внутри стека.

Для людей: курсы, созвоны и обучение сразу на своём языке; поиск внутри видео по смыслу, а не по словам.

🚨 Нам 3.14здец

Узкие SaaS по дубляжу/сабам/модерации — 8/10 — функции уезжают «в комплект» Qwen; что делать: уход в вертикали, он-прем и регуляторные ниши.

Код-ассисты «по подписке» — 7/10 — CI-боты закрывают тесты/рефакторинг на уровне пайплайна; что делать: продавать глубину (безопасность, комплаенс, доменные плагины) или сливаться.

AI зоопарк

Scale

Нейросетей уже дофига. GPT, Claude, Gemini, Qwen, DeepSeek, Mixtral, локальные — интерфейсы одинаковые, обещания одинаковые, а тебе нужна та, что решит конкретные задачи. Есть два пути. Либо тестить каждую на своих сценариях, жечь спринты и бюджет. Либо опереться на чужие оценки: бенчмарки и лидерборды.

Как устроены оценки. Первая ветка — синтетика: готовые наборы вопросов и кода. Там любят MMLU, GSM8K, HumanEval, HellaSwag, ARC и прочие «лабораторные» измерители. Удобно для sanity-check, но это лаборатория: один балл не говорит, как модель держит тон на испанском, что понимает джун, и где она сыпется на реальных регламентах. Вторая ветка — арены человеческих предпочтений. Самая известная — LMSYS Chatbot Arena: два ответа «вслепую», люди голосуют, копится Elo. Ближе к жизни, но без разрезов по аудитории это средняя температура. Кто голосовал, на каком языке, какой опыт — не видно. И да, под такую арену легко подкрутить стиль: длиннее, мягче, с markdown — и уже «лучше».

Теперь бизнес. Представь маркетплейс в Испании, Мексике и ОАЭ. Саппорт для покупателей и селлеров, обучение мерчантов, поиск по базе. Берёшь «победителя» из таблицы — и ловишь реальность. Испанский звучит сухо и канцелярски, арабский путает даты и термины, джунам по SQL приезжают академические полотнища. Эскалаций больше, NPS вниз, ретраев море. Один общий рейтинг — шляпа, когда у тебя три языка и четыре профиля пользователей.

Вот сюда и заходит Scale с SEAL Showdown. Это лидерборды по реальным предпочтениям с разметкой по людям. Их контрибьюторы в ~100 странах и ~70 языках сравнивают фронтир-модели «бок о бок» в Playground, голосование добровольное, сырые данные складируют на 60 дней, чтобы не крутили. На выходе — не «топ-1 вообще», а срезы: язык, возраст, образование (дальше — профессии). Видно, какая модель понятнее новичкам, какая аккуратнее для юристов 45+, где испанский и арабский совпадают с английским, а где разъезжаются. Это инструмент закупки и роутинга, а не витринный кубок.

Как применять. Берёшь свои когорты — испанский онбординг, арабский юрпоток, техподдержка для джунов — и под каждую выбираешь топ-2 из Showdown. Делаешь мульти-модельный роутинг, в SLA фиксируешь «полезно с первой попытки», время до решения и жалобы на тон по каждой когорте. Синтетику держишь как санитарный минимум, но решение принимаешь по предпочтениям реальных людей, похожих на твоих пользователей.

И что?

Для бизнеса: меньше переделок и жалоб, выше «с первой попытки», закупка под аудитории, а не под усреднённый балл.

Для инвесторов: новый дата-актив — предпочтения по языкам и демографии; монетизация через вендоров и due diligence сделок.

Для людей: ответы звучат так, как им удобно — по стилю, по языку, по уровню.

🚨 Нам 3.14здец

Маркетинг «мы №1 в общем рейтинге» — 7/10 — теряет доверие у enterprise, когортные метрики рвут ширму; что делать: публиковать срезы и давать SLA по кластерам.

Команды «одна модель на всех» — 6/10 — тонут в ретраях и падении NPS; что делать: вводить когортный роутинг и выбирать модели под языки и роли.

Google

Google

Жизнь разработчика поменялась. Раньше всё шло по прямой: ТЗ, ручной CRUD, миграции, поиск примеров, тесты с нуля, код-ревью, релиз. Теперь рядом живут ассистенты — Copilot, Cursor/JetBrains AI, Claude, GPT-4o, Gemini, Amazon Q, Codeium. Они пишут болванки и миграции, собирают тест-рыбу, формируют PR-резюме, объясняют чужой код, подсказывают SQL и YAML, вытаскивают куски из внутренней базы знаний. Снаружи выглядит как приговор профессии: «автокод всё съест». На практике картинка сложнее.

Google в свежем DORA-отчёте проверил реальность. Почти 5 000 специалистов, медиана использования — около двух часов в день, охват — 90%. При этом 30% говорят: доверия мало или вовсе нет. И всё равно 80% фиксируют ускорение, 59% — улучшение качества кода. Что это значит в жизни команды: ассистент делает черновик и обвязку, дальше статанализ, тесты, ревью, merge проходит через человека. Массовое использование уживается со скепсисом, потому что инструмент вмонтирован в процесс, а не заменяет его.

Чтобы это давало стабильную пользу, Google описал DORA AI Capabilities Model — семь практик вокруг ассистентов. Ответственность за финальное решение у людей. Выгода появляется там, где есть системный контур, а не красивый демо-ролик.

7 правил, чтобы ИИ давал пользу каждый день (и как именно)

— Правила и ответственный: фиксируем где можно/нельзя, кто решает спорные случаи → меньше стопов и согласований → задачи проходят без «позовите юриста».

— Порядок в материалах: у документов есть владельцы, график обновления, метки свежести → ИИ опирается на актуальные данные → меньше переделок и конфликтов «устарело».

— Контекст компании: ИИ подключён к вашим документам и даёт ответы со ссылками на источник → меньше фантазий → текст сразу годится в работу.

— Малые изменения и быстрый откат: правки маленькими порциями, кнопка «вернуть» за минуты → промахи чинятся быстро → команда не простаивает.

— Встроенность в рабочие инструменты: подсказки и автопроверки прямо там, где вы работаете → меньше переключений и копипаста → время уходит на результат, а не на перетаскивание.

— Метрики на дашборде: видно «полезно с первой попытки», время до результата, долю переделок, время исправления → каждый день понятно, что ускорять и что закрывать.

— Human-gate на финал: человек утверждает итог, след ИИ виден в правках → брак не уходит наружу → меньше жалоб и откатов.

Смысл: ИИ ускоряет, порядок держит качество.

И что?

Для бизнеса: переносим ассистентов из «идеек в IDE» в процесс — метрики и quality-gates в CI/CD, человеческий gate на merge, доступ к внутрянке, ответственность по ролям.

Для инвесторов: ценность у тех, кто превращает часы ассистента в предсказуемый lead time и меньше фейлов релиза.

Для людей: рутина уходит в генерацию и обвязку, время освобождается под архитектуру и решение задач.

🚨 Нам 3.14здец

Команды без автотестов и ревью — 8/10: ускоренная поставка сырца и регрессии в проде. Что делать: жёсткие quality-gates, покрытие, запрет merge без проверок.

Менеджмент со «строками кода» — 7/10: метрика разваливается. Что делать: перейти на DORA-метрики — lead time, change failure rate, time to restore плюс «полезно с первой попытки».

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🛡️ Британия отчиталась: ИИ-инструмент Fraud Risk Assessment Accelerator помог вернуть £480 млн за год (апрель 2024–апрель 2025). Треть суммы — ковидные схемы, которые раньше ускользали. И что? Меньше утечек бюджета и кейсов «растворили компанию — списали долг», дальше ещё и экспорт технологии в другие страны. 

🧰 Microsoft впустил Anthropic в 365 Copilot: Claude Sonnet 4 и Opus 4.1 теперь доступны в Researcher и Copilot Studio. И что? Это первый официальный выбор модели вне OpenAI внутри 365 — можно миксовать движки под задачу (таблицы, презентации, агенты). Плюс: гибкость закупок и снижение рисков «зависимости от одного вендора». 

🏛️ Абу-Даби идёт к статусу «полностью AI-native правительства» к 2027: 200+ AI-решений, 100% суверенного облака, бюджет ~AED13 млрд. И что? Выгода для жителей — быстрее услуги (единый ERP-хребет, TAMM 3.0), для экономики — +AED24 млрд к ВВП и тысячи рабочих мест. 

🎵 Suno выкатил v5: компания заявляет «самую мощную» модель музыкогенерации, улучшенные вокалы, миксы и контроль. И что? Практика — быстрее проход к коммерческому качеству треков и джинглов, меньше ручной пост-обработки. Для создателей — экономия времени и бюджета на продакшен. 

💧 Microsoft показал микро-жидкостное охлаждение кристаллов: жидкость по каналам, протравленным прямо в кремнии, до 3× лучшая теплотрасса и до −65% к пикам температуры. Бонус — плотнее стойки и меньше затрат на «холод», что критично под рост ИИ-нагрузок. 

💸 Cohere привлёк $100 млн, оценка ~$7 млрд; в фокусе — enterprise-платформа North и модели Command A, плюс партнёрство с AMD. И что? Для корпоративных ИТ — ещё один «безопасный» поставщик с внятным прайсингом и контролем данных, для рынка — давление на мульти-вендорные стратегии. 

🧩 Cloudflare открыл VibeSDK: «виб-кодинг» в один клик — свой AI-генератор приложений с песочницей, AI Gateway и деплоем на Workers. И что? Можно быстро поднять внутренний «App Builder» без боли с рантаймом и безопасностью, а код вывозить в свой репозиторий. 

🗂️ Google Labs запустил Mixboard: доска-конструктор идей с текстовыми промптами и картинками, редактирование через модель Nano Banana. И что? Плюс: быстрые варианты концептов, «more like this» и правки на естественном языке — удобно для маркетинга, дизайна и продукт-брейнштормов. 

⚡ OpenAI, Oracle и SoftBank объявили 5 новых площадок Stargate (TX, NM, OH и ещё один сайт на Среднем Западе): цель — довести мощность кластера к 10 ГВт, уже подтверждено ~7 ГВт и >$400 млрд инвестиций. И что? Меньше «дефицита вычислений» для продуктов и исследований. 

🗯️ Маск уколол Anthropic в X: «winning was never in the set of possible outcomes». И что? Факт сам по себе не меняет бенчмарки, но отражает эскалацию конкуренции и давления на юнит-экономику «ассистентов» в enterprise. Для закупок — дополнительный аргумент в пользу мульти-модельных стеков. 

🛡️ SAP и OpenAI запустят «OpenAI for Germany» — суверенную платформу для госслужащих на базе Delos Cloud (Azure-стек), старт в 2026. И что? ИИ-агенты и автоматизация документооборота внутри регуляторных рамок Германии; меньше бумажной рутины, больше времени «на людей». 

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До завтра.
Дмитрий Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.