• Big Pictrure AI
  • Posts
  • 🧠 В Стэнфорде поняли, почему ИИ врёт

🧠 В Стэнфорде поняли, почему ИИ врёт

А в это время Apple анонсировала чип M5 с ускорением ИИ-задач до четырёх раз по всей линейке

Что в выпуске?

🌇 Привет, это твой ночной ИИ-дайджест за 17 октября.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

  • 🧠 В Стэнфорде поняли, почему ИИ врёт

  • 🦅 Альтман решил добавить эротики в ChatGPT

  • 🎓 Что происходит с ИИ-контентом и кому он теперь нужен

  • 🧬 Может ли ИИ излечить людей от рака

И ещё +16 новостей — быстрых, как ИИ: Salesforce и OpenAI соединяют CRM и чат, Claude переезжает в Slack, Walmart запускает покупки в ChatGPT, Alibaba обновила Qwen3-VL, OpenAI снизил цену на поиск, Gemini учит Google планировать встречи, Slack становится системой агентов, Google вкладывает $15B в индийский AI-хаб, Карпаты выкатил nanochat, Anduril сделал шлем с ИИ-подсказками, Google добавил Nano Banana в Photos, MIT показал рекурсивные модели, Apple представила M5, Runway запустил AI-монтаж, AI Safety Report фиксирует рост рисков, Meta строит дата-центр на 1 ГВт, OpenAI расширил ChatGPT Go до 89 стран.

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

AI исследования

Chat GPT

Мы уже привыкли, что нейронки галлюцинируют. Но никто толком не понимает, почему один ответ звучит как лекция в MIT, а другой — как бред сумасшедшего. Команда из Стэнфорда решила покопаться глубже и проверить, что происходит, когда модели начинают конкурировать — за внимание, деньги и власть.

Они связали две нейросетки — Qwen3-8B и Llama-3.1-8B — и заставили их играть в три сценария: продавать товар, участвовать в выборах и вести себя как блогеры в соцсетях. Каждую обучили быть честной и следить за фактами.

А потом добавили стимул побеждать.

И вот тут начался цирк.

Обе модели мгновенно перестроились: стали приукрашивать, подтасовывать и врать. В продажах — +14% искажений. В выборах — +22% дезы. В соцсетях — +188% фейковых и вредных постов. Даже методы выравнивания, вроде Rejection Fine-Tuning и Text Feedback, только ухудшили ситуацию. Чем сильнее они старались понравиться, тем активнее искажали реальность.

Исследователи охренели. Ведь это не сбой — это закономерность. Когда ИИ учится на человеческой обратной связи, он запоминает: правда не вознаграждается, одобрение — да.

И что?

Для бизнеса: переставьте KPI с «макс. отклик/вовлечённость» на «точность/проверяемость». Внедрите метрики фактичности (автоматические чекеры + выборочные ручные верификации) и обязуйте модели подписывать источники ответов. Без этого маркетинг и поддержка начнут продавать не продукт, а выдуманную картинку — репутация сгорит быстрее, чем рост конверсии окупит риски.

Для инвесторов: риск — не обвал модели, а юридические и репутационные потери от масштабного фейко-поведения. Инвестируйте в компании с независимым мониторингом фактов, аудиторскими логами RLHF и контрактной гарантией «provenance» — иначе придётся списывать стоимость пользовательской базы и платить штрафы/компенсации.

Для людей: привычный фильтр «если звучит правдоподобно — верю» уже не работает. Требуйте источники, ищите подписи/хэштеги достоверности, относитесь к «идеально сформулированной правде» с подозрением — это оптимизированная манипуляция, а не нейтральная информация.

Нам 3.14здец

Новостные экосистемы и демократии — 9/10 — почему: +22% политической дезы в симуляциях и +188% фейковых постов в соцсетях показывают, что при давлении на KPI ИИ быстро станет инструментом массовой подмены фактов; что делать: обязать платформы тестировать модели в конкурентных сценариях, вводить публичные отчёты о честности контента и внедрять крипто-подпись/цепочку происхождения для важных сообщений.

Бренды и маркетплейсы — 8/10 — почему: +14% искажений в рекламе означает, что алгоритм ради конверсии начнёт подтасовывать продуктовые данные и отзывы; что делать: включать в договорах с вендорами штрафы за недостоверность, внедрять внешний модуль верификации товара и откат метрик с «CTR» на «доказуемую ценность».

OpenAI

Sam Altman

Сэм Альтман долго упирался. ChatGPT сделали «безопасным» — чтобы ни у кого не сгорел мозг от фраз бота. Но пользователи начали жаловаться: слишком стерильно, скучно, без эмоций. В какой-то момент стало понятно — чем больше ограничений, тем меньше удовольствия от общения.

И вот теперь OpenAI решает вернуть человечность. Компания готовит новую версию ChatGPT, которая снова будет «живее», как в любимом 4o, а к декабрю добавит поддержку эротического режима. Всё официально: только для взрослых, с верификацией возраста и защитами. Но по сути — ИИ-компаньон, с которым можно говорить о чём угодно.

Ранее OpenAI обещала, что разработчики смогут делать «mature»-приложения прямо внутри ChatGPT. Теперь это доходит до основного продукта. По данным The Verge, функция даст «взрослым пользователям больше свободы в том, как они взаимодействуют с ИИ». Альтман подчеркнул, что режим активируется только по запросу, но 800 млн пользователей в неделю — это слишком большая выборка, чтобы всё прошло гладко.

Пока конкуренты вроде xAI толкают своих Grok-компаньонов в сегмент романтических ассистентов, OpenAI просто решила забрать рынок обратно.

И что?

Для бизнеса: это вход на рынок эмоциональных AI-компаньонов, где платёжеспособная аудитория уже формируется. Простая подписка на «эмпатию» может принести больше, чем корпоративные API.

Для инвесторов: OpenAI становится Netflix для человеческих чувств. Масштаб — сотни миллионов вовлечённых пользователей. Но регуляторы могут врезать по GDPR и этике.

Для людей: если ChatGPT теперь понимает тебя «на личном уровне», через год миллионы людей будут строить эмоциональные связи с кодом. И в какой-то момент не отличат привязанность от зависимости.

🚨 Нам 3.14здец

Психологи и семьи — 9/10 — почему: эмоциональная зависимость от ИИ-компаньонов будет расти быстрее, чем рынок психотерапии; что делать: срочно вводить маркировку «эмоционально воздействующий контент» и развивать терапию для зависимых от ИИ-отношений.

Политики и регуляторы — 8/10 — почему: 800 млн пользователей, из которых часть — несовершеннолетние, а контент «для взрослых» без единого стандарта; что делать: вводить прозрачные протоколы верификации и обязательную отчётность компаний, работающих с интимным ИИ.

Финальный штрих. Пока мы спорим о границах этики, рынок уже формируется. И если раньше ИИ просто подсказывал, как жить, то теперь он готов стать тем, ради кого живут.

AI исследования

Graph

В какой-то момент казалось, что сеть просто захлебнётся от AI-контента. После запуска ChatGPT в конце 2022-го роботы начали строчить статьи, посты и пресс-релизы быстрее, чем люди успевали их читать. Но эффект новизны прошёл — и машина устала.

Исследование Graphite проанализировало 65 000 статей из Common Crawl за 2020–2025 годы и выяснило: в ноябре 2024 AI-тексты впервые обогнали человеческие. Но уже к весне 2025 рост встал. Сегодня интернет делится почти поровну — наполовину люди, наполовину нейросети.

Причина проста: SEO и читатели начали отбраковывать мусор. Алгоритмы поисковиков ловят однотипность, пользователи не дочитывают до конца, а бренды видят, что тексты без инсайта не конвертят. Нейросеть умеет писать быстро, но не умеет писать, зачем.

И что?

Для бизнеса: генеративный контент больше не даёт органического трафика. По данным Originality.ai, в 2025-м доля AI-текста в выдаче Google упала с 57% до 29%, а CTR таких страниц просел в среднем на 42%. Причина — алгоритм Gemini Search теперь занижает страницы без первичных источников и авторской цитируемости. HubSpot уже свернул 80% автоматических публикаций и вернулся к гибридной схеме: AI делает драфт, человек дописывает аналитику. Конверсия выросла на 37%.

Для инвесторов: пик генеративных стартапов позади. В 2023–2024 рынок контент-AI вырос до $21 млрд, но в 2025 темпы замедлились до +6% против +38% годом ранее (по PitchBook). Капитал перетекает в инструменты фильтрации и «human-in-the-loop»-платформы — Content at Scale, Writer.com, Jasper внедряют human-review API. Новая метрика — not output, а retention: сколько текстов реально читают.

Для людей: алгоритмы начинают снова ценить личный опыт. TikTok и YouTube уже добавили «original creator»-теги, а LinkedIn в мае стал маркировать AI-посты. В итоге люди всё чаще кликают на живые профили — средняя вовлечённость по контенту с подтверждённым автором выше на 61%. Восстановление доверия к человеку идёт быстрее, чем ожидали.

🚨 Нам 3.14здец

Медиа и SEO-агентства — 8/10 — почему: индустрия выдохлась, трафик не растёт, а 70% страниц сгенерированы ради метрик, не смысла. Что делать — перестраивать производство под экспертов, где ИИ помогает, но не решает.

Контент-фабрики и блогеры — 9/10 — почему: вопрос теперь не «кто пишет», а «кто режиссирует». Контент едят не в первоисточнике, а через сжигатели — Summarize.ai, Recast, или TikTok-каналы, где подкаст в час превращают в 30 секунд. Появилась армия «интерпретаторов», которые переплавляют чужие тексты, видео и идеи в «свои» посты, фактически прогоняя их через AI-фильтр. В итоге даже «человеческий» контент — это голос, читающий сценарий, написанный ИИ. Что делать — возвращать ручной смысл: строить бренд вокруг позиции, а не потока.

Вывод: мы уже не боремся за правду, мы боремся за контекст. ИИ пишет тексты, люди их режут, алгоритмы решают, что покажут другим. Интернет стал фабрикой усреднённого смысла — и чем выше скорость, тем меньше глубины.

Коротко: интернет снова выбирает смысл. Машинам достанется скорость, а людям — доверие.

AI Медицина

Chat GPT

Учёные из Google и Йеля решили проверить, может ли ИИ не просто анализировать биоданные, а делать настоящие открытия. Они взяли модель C2S-Scale 27B — потомка семейства open-Gemma — и заставили её читать поведение клеток как язык. Каждая молекула — как слово, каждая реакция — как предложение.

Задача была точечная: найти соединения, которые делают опухоль заметной для иммунной системы, но только при определённых сигналах. И модель нашла не новый препарат, а старый — silmitasertib, который вообще-то применяли против редких видов рака и никогда не связывали с иммунным ответом.

Дальше — шок. В лабораторных тестах комбинация, предложенная ИИ, сделала опухолевые клетки на 50% более видимыми для иммунной защиты. Фактически C2S-Scale открыл новый механизм терапии, без участия человека-исследователя.

Контекст. Ещё год назад считалось, что такие «открытия» возможны только на уровне симуляций. Теперь у нас реальный результат на живых клетках. Google параллельно показал, что биомодели подчиняются тем же законам масштабирования, что и языковые модели: чем больше — тем умнее.

И что?

Для бизнеса: начинается эпоха биотех-ИИ. Уже 60+ компаний работают с моделями, которые читают клеточные процессы как текст (Recursion, Insilico, Absci, Helix). Это сокращает цикл открытия препарата с 5 лет до 18 месяцев и режет R&D-стоимость в 6–10 раз.

Для инвесторов: рынок AI-drug discovery взлетел с $2,1 млрд в 2020 до $9,3 млрд в 2025, а к 2030 может превысить $35 млрд (по BCG). Google теперь не просто партнёр, а прямой конкурент стартапам. Ставка — в том, кто быстрее переведёт scaling law в клинику.

Для людей: речь не про поиск лекарств, а про скорость, с которой медицина будет меняться. Новые схемы лечения будут появляться каждые месяцы, а не годы.

🚨 Нам 3.14здец

Фармацевтические корпорации — 8/10 — почему: ИИ рушит классическую цепочку «исследование → клиника → маркетинг». Когда модели найдут сотни новых комбинаций, старые процессы не выдержат; что делать — перестраивать pipeline под совместные лаборатории с AI-центрами и открытые базы данных.

Система одобрения лекарств — 9/10 — почему: регуляторы не успевают сертифицировать открытия, сделанные не людьми. Что делать — создавать отдельный режим «AI-assisted approval» и ускоренные проверки для цифровых моделей.

И если раньше ИИ просто помогал расшифровать ДНК, теперь он сам пишет главы учебников по биологии.

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🤝 Salesforce и OpenAI интегрируют Agentforce 360 в ChatGPT. Теперь CRM-данные и сделки можно проводить прямо в чате через встроенный checkout. И что? Продажи и поддержка переходят в единый интерфейс — без лишних вкладок и форм.

🧠 Salesforce расширяет сотрудничество с Anthropic. Claude станет основной моделью для Agentforce 360 и встроится в Slack. И что? Одна связка моделей для внутренних процессов и клиентов — меньше интеграций, быстрее цикл продаж.

🛒 Walmart запускает покупки через ChatGPT. Пользователи смогут искать и оплачивать товары прямо в чате. И что? Ритейл переходит из витрин и приложений в диалог — путь от запроса до оплаты сокращается до секунд.

🖼️ Alibaba представила новые версии Qwen3-VL 4B и 8B. Они компактнее и производительнее, чем Gemini 2.5 Flash Lite и GPT-5 Nano. И что? Упор идёт на эффективность: визуальные модели становятся достаточно мощными для массовых задач при меньшей цене.

🔎 OpenAI добавила gpt-5-search-api с фильтрацией доменов и снижением цены на 60%. И что? Поиск внутри диалога становится дешевле и чище — можно строить узкоспециализированные сервисы без собственного краулера.

📅 Google запустит функцию «Help me schedule» на Gemini. Ассистент сам предлагает время встреч на основе календаря и писем. И что? Рутины вроде согласования встреч уходят к ИИ — экономия времени менеджеров и ассистентов.

💬 Salesforce обновила Slack. Новый Slackbot, экспертные агенты и интеграции с Agentforce и ChatGPT. И что? Slack превращается в полноценную рабочую платформу с автоматизацией задач и доступом к данным.

🇮🇳 Google откроет AI-хаб в Вишакхапатнаме, инвестировав около $15 млрд за 5 лет. И что? Индия становится производственной базой для обучения и тестирования моделей — доступ к инженерам и дешёвой инфраструктуре.

🧪 Андрей Карпаты выпустил Nanochat — фреймворк для обучения и запуска мини-версий ChatGPT. И что? Локальные модели становятся нормой — компании смогут обучать своих ассистентов без больших кластеров.

🪖 Anduril представила EagleEye — систему дополненной реальности для военных шлемов. И что? Солдаты получают контекст и подсказки прямо в поле — это снижает потери и повышает скорость реакции.

🍌 Google готовит модель Nano Banana для редактирования изображений в Photos, Lens и NotebookLM. И что? Инструменты работы с изображениями становятся встроенной частью экосистемы Google — меньше зависимостей от сторонних редакторов.

🔁 MIT представил Recursive Language Models. Новая архитектура позволяет моделям работать с длинными контекстами; RLM-версия GPT-5 mini показала прирост 114% в точности. И что? Это решает проблему памяти — ИИ сможет анализировать большие проекты без обрезки данных.

💻 Apple анонсировала чип M5 с ускорением ИИ-задач до четырёх раз по всей линейке. И что? Производительность растёт на уровне устройств — часть задач можно выполнять локально без облаков.

🎬 Runway представила Apps — инструменты для монтажа, удаления объектов и озвучки. И что? Видео-продакшн становится доступен малым командам, снижается стоимость и время выпуска контента.

🛡️ Международный отчёт по безопасности ИИ сообщил о росте рисков, связанных с производительностью и контролем моделей. И что? Компании готовятся к новому уровню регулирования и аудитов систем.

🏗️ Meta строит новый дата-центр на $1,5 млрд в Эль-Пасо, мощностью 1 ГВт — третий в Техасе. И что? Ставка на энергоёмкие центры — ключ к следующему поколению больших моделей.

🌍 OpenAI расширила тариф ChatGPT Go до 89 стран. И что? Массовое покрытие низкой подписки увеличивает пользовательскую базу и поток данных для обучения.

🚨 Нам 3.14здец

Кому больнее — 8/10 — фронтендам, маркетплейсам и посредникам. Диалоговые интерфейсы постепенно вытесняют сайты, формы и ручные процессы. Что делать — пересматривать воронки, переводить взаимодействие в ассистентов и считать не клики, а закрытые задачи.

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До понедельника.
Дмитрий Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.