• Big Pictrure AI
  • Posts
  • 💀 Claude отправляет MS Office на покой

💀 Claude отправляет MS Office на покой

А в это время Google включил вертикальное видео 9:16 и 1080p в Veo 3/Veo 3 Fast

Что в выпуске?

🌇 Привет, это твой дневной да еще и воскресный ИИ-дайджест за 14 сентября.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

  • 🦅 Claude делает Excel/Word/PPT/PDF прямо в чате — меньше копипаста, отчёты и деки за минуты

  • 🧠 AlterEgo: команды «про себя» без голоса и рук — отвечаешь на питчинге молча, быстрее и приватнее

  • 🎓 RSL для веба: издатели ставят ценник ИИ-краулерам — ясные правила и новая выручка вместо халявы

И ещё +8 новостей быстрых, как ИИ: Google Veo 3/Veo 3 Fast — вертикалка 9:16, 1080p и цена ниже вдвое; Adobe Agent Orchestrator — 6 агентов для маркетинга/CX; Meta × Black Forest Labs — контракт $140M на AI-изображения; и другие новости.

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

Antropic

Chat GPT-5

Вечер, дедлайн через 30 минут. У вас — CSV с сырыми продажами, черновик протокола и просьба «скиньте нормальный отчёт в PDF и 5 слайдов для совета». Обычно это жонглирование: Excel, Word, PowerPoint, экспорт, правки. Теперь вы пишете в чат: «Собери сводку по регионам, маржа, графики, сравнение с прошлым кварталом, оформи в XLSX + PDF + 5 слайдов». И получаете готовые файлы без открытия приложений.

Anthropic включила в Claude создание и редактирование Excel, Word, PowerPoint и PDF прямо в claude.ai и десктопе. Под капотом — приватная среда, где Claude пишет и запускает код, строит диаграммы, формулы и рендерит «готовые к отправке» файлы. Можно конвертировать форматы: из PDF в слайды, из заметок — в документ. Превью доступно для Max, Team и Enterprise; Pro — в ближайшие недели. Антропик советует начинать с «простых» задач и отдельно предупреждает о рисках при выдаче доступов в интернет (инъекции подсказок, утечки). 

Контекст. Это прямой заход в офисную рутину, где доминировал OpenAI: «файлы из чата» уже есть у ChatGPT, и теперь Claude бьёт в ту же зону. Плюс свежие коннекторы (Drive, Slack, Canva) — меньше переключений между софтом. Для корпоративки — сильный апсейл Max/Enterprise.

И что?

Для бизнеса. Не нужно прыгать между Excel, Word и PowerPoint — Claude делает всё в одном месте. Те же люди закрывают больше задач: отчёты, борд-деки, сводки из CSV → XLSX → PDF → PPT проходят одной командой в чате. Результат: в краткосроке — рост производительности и заморозка найма на джуниорские роли; в среднесроке — сокращение 10–20% рутинных ставок там, где работа = форматирование и конвертация. Главные выигравшие — SMB, отделы финансов, сейлз-опс, консалтинг, закупки, комплаенс, где «бумага» — ключевой продукт.

Для инвесторов. Начинается передел «офисного слоя»: ассистент становится файловой ОС. Anthropic поднимает выручку в Max и Enterprise за счёт генерации файлов и интеграций с корпоративными хранилищами. Под угрозой — нишевые тулзы по конвертации и автоматизации отчётов. Ключевые сигналы: доля задач «файл из чата» в активной аудитории и рост подключений к Drive/Slack. Риск — безопасность и комплаенс при работе в песочнице с доступом в интернет.

Для людей. Больше не нужно знать формулы или верстку: достаточно описать задачу словами и получить готовый XLSX, PPT или PDF. Меньше копипаста и ошибок, быстрее согласование. Но возрастает ответственность за постановку задачи и проверку итогов.

Для человечества. Автоматизация убирает барьер входа в «офисную» работу: любой человек может создавать документы, не имея навыков. Цена — поток синтетических данных и новые угрозы утечек, что приведёт к росту регулирования и обязательной маркировке ИИ-контента.

🚨 Нам 3.14здец

BPO/KPO-«докфабрики» (Индия, Филиппины, Восточная Европа) — 7/10. Конвейер «из PDF в слайды / из заметок в отчёт» переезжает в Claude. Рынок BPO — $300B+, миллионы рабочих мест под угрозой. Что делать: уходить в QA, аналитику и экспертизу.

Нишевые конвертеры и аутсорс на презентации8/10. Функция внутри ассистента убивает спрос на отдельное ПО и услуги «сделайте нам дека». Что делать: фокус на безопасности, аудите и deep-интеграциях.

Офисные фронтенды6/10. Всё чаще работа идёт через ассистента, а не через привычные интерфейсы. Что делать: строить ассистента внутри своих экосистем или терять пользователей.

MIT

Chat GPT-5

Бывают моменты, когда ошибка стоит денег, времени и шанса. Например: вы питчите свой стартап. В голове — юнит-экономика, дорожная карта, размер рынка. А у инвесторов — бонус-вопросы: налог на опционы в Сингапуре, счёт у «Реала», чей-то улов на вчерашней рыбалке. Вы спокойны: никакой вопрос не выбивает. Телефон в кармане слышит комнату и молча возвращает ответы — не как у Шурика с Дубом, повязкой и радиоподсказкой под глушилку, а сразу «в голову», без жестов и шёпота. 

Что это вообще делает. AlterEgo (спин-офф MIT Media Lab) показал гарнитуру Silent Sense: она улавливает субвокализацию — микросигналы речевой системы, когда вы осознанно «про себя» произносите слова без звука. Дальше ИИ распознаёт фразу и исполняет команду, а ответ приходит через костную проводимость. На демо — набор текста, ответы в мессенджере, визуальные запросы, синхронный перевод и «тихий» диалог между двумя носителями; заявлены шумные условия и мультиязычность. Мысли не читает: работает только на намеренно сформулированных словах. 

Как этим «говорить». Ничем заметным «шевелить» не нужно. Когда вы проговариваете фразу внутри, речевые мышцы (язык, челюсть, горло) дают микродвижения — их и ловят сенсоры (в новой версии говорят о мини-камерах вокруг уха и шеи). Лайфхак: произносите слова чётко про себя, как при шёпоте с закрытым ртом — точность выше. 

Откуда это взялось. В 2018 MIT показал прототип AlterEgo: неинвазивный интерфейс, 92% медианная точностьна словаре цифр, двусторонний канал с костной проводимостью. В 2025 команда оформилась в стартап AlterEgo и вышла из стелса с демонстрацией Silent Sense. Сроков коммерческого запуска пока нет. 

Контекст: кто ещё пытался.

Инвазивные BCI: Neuralink — чип в мозг; первый имплант человеку в январе 2024, дальше десятки пользователей, демонстрации курсора, шахматы, Civilization. Суперскорость, но хирургия и регуляторные риски. 

EMG-браслеты на запястье: CTRL-labs (купил Facebook/Meta за $500M–$1B) считывает нервные импульсы с предплечья; Meta до сих пор строит интерфейс для AR-очков на этой базе. Подход близкий по духу: тоже «не чтение мыслей», а декод намерения движения/речи по периферии. 

EEG-шлемы: OpenBCI Galea (десятки тысяч $) и Emotiv (от $499–$999) — это в основном исследования и девкиты; для повседневки громоздко и чувствительно к шуму. Упор на мозговые сигналы, а не на речевой тракт. 

Почему сейчас это важно. MIT-прототипы уже показали, что «внутренняя речь» читается неинвазивно; стар обещает расширенный словарь, диалог носитель-носитель и «тихий ввод» в шуме. Если подтвердятся метрики (точность, задержка, устойчивость к шуму), это новый базовый интерфейс там, где голос и руки неудобны. 

И что?

Для бизнеса: пилот 30 дней на 20–50 устройств в митинговых зонах и колл-центрах; KPI на вход: −30% времени ответа, −15% ошибок в задачах, где сейчас голос/ручной ввод. Интеграции: Slack/Google Workspace/VS Code; подтверждение — сравнение до/после по SLA. 

Для инвесторов: смотреть на юнит-экономику железки (BOM, ASP, сервис), реальную точность ≥90% и задержку ≤300 мс в полях. Адресуемый сегмент даже при 1% от пользователей смартфонов — десятки миллионов штук. Риск: хайп без пилотов ≥1k устройств. 

Для людей: «говорить» молча в офисе, транспорте и на встречах; приватность и скорость без телефонов и шёпота; плюс мощная ассистивка для тех, кто потерял голос. 

🚨 Нам 3.14здец

Экзаменационные анти-чит-системы — 8/10: «тихий ввод» обходит обычные микрофоны и прокторинг. Что делать: очные ключевые экзамены, биометрика и задачи с разбором решения вместо тестов.

Голосовые ассистенты и BPO-саппорт — 7/10: «оператор + AI + silent-input» закрывает больше кейсов тем же штатом; 10–20% рутинных позиций уйдут в ближайшие волны автоматизации. Что делать: апскилл в AI-супервайзеров, выпуск собственных silent-модулей.

Авторские права vs ИИ

Chat GPT - 5

У вас контент, у ИИ-компаний — пауки, которые его снимают для обучения. robots.txt раньше умел только «пускать/не пускать». Денег там не было. Теперь появляется RSL (Really Simple Licensing): к правилам для ботов добавляются машиночитаемые условия оплаты — подписка, pay-per-crawl за каждый заход и даже pay-per-inference (если ваш текст реально попал в ответ модели). Инициативу поддержали крупные площадки (Reddit, Yahoo, Medium, Quora и др.), а управляет этим некоммерческий RSL Collective по логике музыкальных правок типа ASCAP/BMI; техчасть ведёт Эккарт Вальтер (со-создатель RSS). 

Как это работает на практике. RSL-условия прописываются поверх robots.txt; «правильный» бот приходит с лицензией/токеном, сайт его пропускает и считает деньги. Сам по себе RSL ботов не блокирует, поэтому RSL Collective подключил Fastly: на периметре проверяют «есть лицензия — заходи, нет — разворачиваем». Параллельно Cloudflare идёт своим путём: по умолчанию блокирует AI-краулеры и запускает рыночек Pay Per Crawl (HTTP 402 «Payment Required») — владелец домена назначает цену, бот либо платит, либо уходит. 

Контекст и момент. Издатели давно продают доступ по индивидуальным сделкам; RSL пытается сделать это массовым и одинаковым для всех (как в музыке), чтобы ИИ-игрокам не вести тысячи переговоров и не жить в юридическом тумане. Но узкое место — исполнение: часть ботов маскируются и игнорируют правила; потому связка со слоями Fastly/Cloudflare — ключевой рычаг. 

И что?

Для бизнеса (издатели): появляется стандартный прайс-лист «для ИИ» + инкассо через коллективную организацию; меньше кастомных договоров, больше предсказуемой выручки. Выгодно новостям, справочникам, учебным и техкорпусам.

Для ИИ-компаний: юридическая ясность и простой доступ к лицензированным источникам; новая строка OPEX за данные. 

Для инвесторов: смотрим долю Топ-доменов с RSL, число «лицензированных» обращений у крупных ИИ-провайдеров и партнёрства с Fastly/Cloudflare — это индикаторы, что рынок переходит от «бери и беги» к платной модели. 

Для людей: если за скрап платят, у издателей меньше стимулов закручивать пейволлы; возможная обратка — чуть дороже/медленнее ответы ИИ на свежем контенте. 

🚨 Нам 3.14здец

Малые ИИ-лабы и «серые» датасет-перекупы8/10: периметр + лицензии закрывают «бесплатный стол». Что делать: уходить в лицензионные пулы или в узкие корпоративные данные. 

SEO-фермы и копипаст-агрегаторы7/10: без оплаты и доступа ценность падает. Что делать: легализоваться и давать добавленную ценность.

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🎬 Google включил вертикальное видео 9:16 и 1080p в Veo 3/Veo 3 Fast, одновременно урезал цену примерно вдвое. И что? Переносите перформанс-креативы в вертикалку: на тех же $1000 генерите в 2–2.7× больше роликов; ориентир по деньгам — ~$3.20 за 8 сек в Veo 3 и ~$1.20 в Veo 3 Fast.

🧩 Adobe запустила Agent Orchestrator с 6 агентами (в т.ч. Audience Agent и Journey Agent) для автоматизации маркетинга/CX. И что? Соберите три цепочки «холодный→триал→повтор»: агенты сами сегментируют и запускают джорни; KPI на неделю — +30% A/B-итераций, −20% ручных настроек аудиторий.

🧰 Anthropic официально признал просадки качества ответов за последний месяц («намеренно не ухудшали»). И что? Введите бекап-провайдера и алерты по качеству: чек-промпты на ваши кейсы раз в день, авто-переключение модели при падении метрик, ручная валидация для критичных задач.

🗣️ ElevenLabs добавил Voice Remixing — можно изменять параметры как фирменных, так и пользовательских голосов. И что? Сделайте бренд-голос под 5 рынков за спринт: пресеты тембра/темпа, whitelist голосов, логирование согласий; включите водяные знаки и запрет на имперсонации в политике.

🧠 Baidu выкатил ERNIE X1.1 — новый reasoner с меньшими «галлюцинациями» и сильными бенчами. И что? Для Китая это способ снизить лицензионные расходы: гоняйте задачи на рассуждение (аналитика/агентные пайплайны) и сравните TCO с западными моделями.

🏜️ ОАЭ представили K2 Think (32B, open-source, на Qwen 2.5) — быстрый reasoner малого размера. И что? Разворачивайте локально: PII остаётся внутри периметра, задержка ниже, расходы предсказуемы; хороший кандидат для внутренних ассистентов.

🎵 Stability AI выпустила Stable Audio 2.5: генерит треки до 3 минут за секунды, рассчитан на энтерпрайз-пайплайны. И что? Соберите библиотеку из 30 коротких тем под рекламу/продуктовые ивенты; пересмотрите закупку сток-аудио, добавьте финальный чек прав на выкладке.

🖼️ Meta подписала многолетний контракт на $140M с Black Forest Labs (после сделки с Midjourney) — усиливает свой стек генеративной графики. И что? Готовьте «креатив как переменную»: на один оффер — 100+ вариантов в Ads/IG, бренд-гайды — как пресеты, бюджет — в сторону частоты итераций.

🚨 Нам 3.14здец

Больнее всего прилетит по «кнопочной» креатив-рутине и офисной сборке материалов — 7/10: генерация/оркестрация уезжают в ассистентов. Что делать: считать минуты генерации, увеличивать число итераций на гипотезу, держать фолбэк-модель и политики по безопасности/голосам.

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До понедельника.
Дмитрий Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.