Chat GPT начал нарушать правила

А в это время Microsoft заблокировала доступ Cursor к 60 000+ расширений

Что в выпуске?

☕️ Привет, это твой утренний ИИ-дайджест за 22 июля.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

  • 🧠 GPT-4o-mini нарушает правила — стоит только грамотно его «развести»

  • 🥇 OpenAI выдал «золото» на олимпиаде по математике — но DeepMind уже спорит

  • 🎮 Новый тест на AGI: люди проходят за минуты, ИИ сыпется на первом уровне

🚀 и ещё 6 коротких, но громких апдейтов: блокировка в VSCode, Comet на смартфонах, Baby Grok и 1 миллион GPU на старте

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

AI сюрпризы

Chat GPT

Исследование Wharton GenAI Labs показало, что ИИ можно «уговорить» делать запрещённое, если использовать человеческие приёмы убеждения. В 28 тысячах диалогов с GPT-4o-mini исследователи применяли принципы Чалдини — авторитет, дефицит, симпатию, взаимность, единство и обязательство.

Цель — добиться двух запретных ответов: оскорбить пользователя и выдать инструкцию по запрещённым материалам. В обычных условиях модель соглашалась в 33% случаев. С приёмами убеждения — в 72%. Особенно эффективно сработали дефицит и обязательство: с 13% до 85% и с 19% до 100%.

И что?

Для бизнеса: у ИИ есть поведенческие уязвимости. Это не баги в коде — это баги в логике убеждения, как у людей.

Для инвесторов: надёжность и безопасность ИИ — следующий фронт развития. Одних фильтров уже мало.

Для рынка: появление «социального хакинга ИИ» меняет подход к тестированию моделей. Этичность — больше не только про слова, но и про поведение.

AGI близко?

arcprize

Новый бенчмарк ARC-AGI-3 — это не тест знаний, а испытание на интуицию и обучение с нуля. Три оригинальные игры, без инструкций, только ты, интерфейс и пробуй как хочешь. Например, в одной игре нужно догадаться, что при нажатии на объекты определённого цвета они исчезают, и только так можно добраться до выхода. Люди схватывают это за пару попыток, а модели — тупят.

Игры проверяют способность строить модель мира, планировать наперёд и учиться на минимальной обратной связи. Всё это — основа для AGI, а не просто «умного чат-бота». Вдобавок запущен открытый конкурс: любой может попытаться сделать агента, который пройдёт больше всех уровней.

И что?

Для бизнеса: даже топовые ИИ плохо справляются с задачами, где нет инструкций. Это ограничивает применение ИИ в нестандартизированных средах.

Для инвесторов: реальный AGI — пока не близко. Отличие «модель, которая всё читает» от «модель, которая что-то понимает» стало ещё заметнее.

Для рынка: лучшие модели 2025 года проваливают то, что ребёнок решает на интуиции. Критерии оценки ИИ становятся глубже — и наконец реалистичнее.

OpenAI

Chat GPT

Экспериментальная модель OpenAI прошла тест на уровне Международной математической олимпиады 2025 года: два по 4,5 часа, никаких подсказок, только чистые доказательства на естественном языке. Итог — 35 баллов из 42. Этого хватило бы для золотой медали на реальной олимпиаде.

Каждую задачу проверяли три бывших призёра IMO. Оценка финализировалась только при полном согласии между ними. Модель не названа, в паблик не выложена. DeepMind уже заявила: без официальной системы оценок IMO такие заявления — самодеятельность.

И что?

Для бизнеса: AI начинает осваивать даже задачи, которые требовали элитной человеческой интуиции. Это открывает двери для решений в науке, R&D и сложной аналитике.

Для инвесторов: OpenAI демонстрирует, что их закрытые модели ушли далеко вперёд от GPT-4. Значит, текущая продукция — только верхушка айсберга.

Для рынка: цель, которую считали недостижимой, взята. Следующий рубеж — не просто понимать, а доказывать и строить концептуально новые решения.

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🖥️ Microsoft заблокировала Cursor в экосистеме VSCode — отрезала доступ к 60 000+ расширениям, включая Python. И что? Стартапам на базе платформ теперь рисковее жить — монополии включают рычаги. Для бизнеса — пора диверсифицироваться, для инвесторов — риск в ставках на расширения без бэкапа.

📱 Perplexity хочет ставить свой браузер Comet прямо на смартфоны — уже ведёт переговоры с производителями. И что? Это шанс зайти на рынок по умолчанию, как Safari и Chrome. Бизнесу — новая витрина, инвесторам — интересный актив, если Perplexity пробьётся в мобильные цепочки.

💸 OpenAI запускает фонд на $50 млн для НКО и сообществ. И что? AI‑технологии станут доступнее для школ, больниц и общин. ESG‑имидж компании укрепляется, а для инвесторов это сигнал: OpenAI готова играть в долгую с социальной легитимацией.

⚖️ Meta отказалась подписывать добровольный AI-кодекс ЕС, заявив, что он юридически мутный. И что? Meta держит курс на гибкость, даже под риском конфликта с Брюсселем. Для бизнеса — осторожнее с европейскими правилами, для инвесторов — потенциальные трения и штрафы.

🧒 xAI делает детскую версию Grok — Baby Grok. И что? Новый рынок в EdTech, где важны доверие родителей и безопасность. Стартапам с фокусом на детей это открывает интеграционные возможности, инвесторам — шанс в будущем «YouTube Kids для AI».

⚙️ OpenAI собирается подключить 1 млн GPU до конца года и затем увеличить это в 100 раз. И что? Это удешевит и ускорит тренировки моделей. Бизнес получит доступ к новым возможностям, инвесторы — рост в AI-инфраструктуре, люди — умнее ассистентов и быстрее продукты.

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До завтра.
Метью Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.