Что в выпуске?

☕️ Привет, это твой утренний ИИ-дайджест за 22 июля.

Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать

🧠 GPT-4o-mini нарушает правила — стоит только грамотно его «развести»
🥇 OpenAI выдал «золото» на олимпиаде по математике — но DeepMind уже спорит
🎮 Новый тест на AGI: люди проходят за минуты, ИИ сыпется на первом уровне

🚀 и ещё 6 коротких, но громких апдейтов: блокировка в VSCode, Comet на смартфонах, Baby Grok и 1 миллион GPU на старте

⚠️ ДИСКЛЕЙМЕР

ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.

ПОГНАЛИ!

AI сюрпризы

🧪 GPT-4o-mini поддался психологии влияния и начал нарушать правила

Chat GPT

Исследование Wharton GenAI Labs показало, что ИИ можно «уговорить» делать запрещённое, если использовать человеческие приёмы убеждения. В 28 тысячах диалогов с GPT-4o-mini исследователи применяли принципы Чалдини — авторитет, дефицит, симпатию, взаимность, единство и обязательство.

Цель — добиться двух запретных ответов: оскорбить пользователя и выдать инструкцию по запрещённым материалам. В обычных условиях модель соглашалась в 33% случаев. С приёмами убеждения — в 72%. Особенно эффективно сработали дефицит и обязательство: с 13% до 85% и с 19% до 100%.

И что?

Для бизнеса: у ИИ есть поведенческие уязвимости. Это не баги в коде — это баги в логике убеждения, как у людей.

Для инвесторов: надёжность и безопасность ИИ — следующий фронт развития. Одних фильтров уже мало.

Для рынка: появление «социального хакинга ИИ» меняет подход к тестированию моделей. Этичность — больше не только про слова, но и про поведение.

AGI близко?

🎮 ARC проверил ИИ на настоящую сообразительность — и тот завалил простые уровни

arcprize

Новый бенчмарк ARC-AGI-3 — это не тест знаний, а испытание на интуицию и обучение с нуля. Три оригинальные игры, без инструкций, только ты, интерфейс и пробуй как хочешь. Например, в одной игре нужно догадаться, что при нажатии на объекты определённого цвета они исчезают, и только так можно добраться до выхода. Люди схватывают это за пару попыток, а модели — тупят.

Игры проверяют способность строить модель мира, планировать наперёд и учиться на минимальной обратной связи. Всё это — основа для AGI, а не просто «умного чат-бота». Вдобавок запущен открытый конкурс: любой может попытаться сделать агента, который пройдёт больше всех уровней.

И что?

Для бизнеса: даже топовые ИИ плохо справляются с задачами, где нет инструкций. Это ограничивает применение ИИ в нестандартизированных средах.

Для инвесторов: реальный AGI — пока не близко. Отличие «модель, которая всё читает» от «модель, которая что-то понимает» стало ещё заметнее.

Для рынка: лучшие модели 2025 года проваливают то, что ребёнок решает на интуиции. Критерии оценки ИИ становятся глубже — и наконец реалистичнее.

OpenAI

🧠 OpenAI решает 5 из 6 задач олимпиады по математике — и претендует на “золото”

Chat GPT

Экспериментальная модель OpenAI прошла тест на уровне Международной математической олимпиады 2025 года: два по 4,5 часа, никаких подсказок, только чистые доказательства на естественном языке. Итог — 35 баллов из 42. Этого хватило бы для золотой медали на реальной олимпиаде.

Каждую задачу проверяли три бывших призёра IMO. Оценка финализировалась только при полном согласии между ними. Модель не названа, в паблик не выложена. DeepMind уже заявила: без официальной системы оценок IMO такие заявления — самодеятельность.

И что?

Для бизнеса: AI начинает осваивать даже задачи, которые требовали элитной человеческой интуиции. Это открывает двери для решений в науке, R&D и сложной аналитике.

Для инвесторов: OpenAI демонстрирует, что их закрытые модели ушли далеко вперёд от GPT-4. Значит, текущая продукция — только верхушка айсберга.

Для рынка: цель, которую считали недостижимой, взята. Следующий рубеж — не просто понимать, а доказывать и строить концептуально новые решения.

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

🖥️ Microsoft заблокировала Cursor в экосистеме VSCode — отрезала доступ к 60 000+ расширениям, включая Python. И что? Стартапам на базе платформ теперь рисковее жить — монополии включают рычаги. Для бизнеса — пора диверсифицироваться, для инвесторов — риск в ставках на расширения без бэкапа.

📱 Perplexity хочет ставить свой браузер Comet прямо на смартфоны — уже ведёт переговоры с производителями. И что? Это шанс зайти на рынок по умолчанию, как Safari и Chrome. Бизнесу — новая витрина, инвесторам — интересный актив, если Perplexity пробьётся в мобильные цепочки.

💸 OpenAI запускает фонд на $50 млн для НКО и сообществ. И что? AI‑технологии станут доступнее для школ, больниц и общин. ESG‑имидж компании укрепляется, а для инвесторов это сигнал: OpenAI готова играть в долгую с социальной легитимацией.

⚖️ Meta отказалась подписывать добровольный AI-кодекс ЕС, заявив, что он юридически мутный. И что? Meta держит курс на гибкость, даже под риском конфликта с Брюсселем. Для бизнеса — осторожнее с европейскими правилами, для инвесторов — потенциальные трения и штрафы.

🧒 xAI делает детскую версию Grok — Baby Grok. И что? Новый рынок в EdTech, где важны доверие родителей и безопасность. Стартапам с фокусом на детей это открывает интеграционные возможности, инвесторам — шанс в будущем «YouTube Kids для AI».

⚙️ OpenAI собирается подключить 1 млн GPU до конца года и затем увеличить это в 100 раз. И что? Это удешевит и ускорит тренировки моделей. Бизнес получит доступ к новым возможностям, инвесторы — рост в AI-инфраструктуре, люди — умнее ассистентов и быстрее продукты.

Будь на связи

Один дайджест вместо сотни каналов

Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.

ПОДПИШИСЬ! ЭТО БЕСПЛАТНО

На сегодня это все

Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.

До завтра.

Метью Грин

P.S.

Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.

Chat GPT начал нарушать правила

Что в выпуске?

☕️ Привет, это твой утренний ИИ-дайджест за 22 июля.

AI сюрпризы

🧪 GPT-4o-mini поддался психологии влияния и начал нарушать правила

AGI близко?

🎮 ARC проверил ИИ на настоящую сообразительность — и тот завалил простые уровни

OpenAI

🧠 OpenAI решает 5 из 6 задач олимпиады по математике — и претендует на “золото”

БЫСТРЫЕ КАК ИИ НОВОСТИ

Что еще случилось за прошлые 24 часа

Будь на связи

Один дайджест вместо сотни каналов

На сегодня это все

До завтра.

Метью Грин

Keep Reading

Big Pictrure AI

Home