- Big Pictrure AI
- Posts
- Chat GPT начал нарушать правила
Chat GPT начал нарушать правила
А в это время Microsoft заблокировала доступ Cursor к 60 000+ расширений

Что в выпуске?
☕️ Привет, это твой утренний ИИ-дайджест за 22 июля.
Вот что я тебе сегодня приготовил и зачем тебе тратить 5 минут чтобы это прочитать
🧠 GPT-4o-mini нарушает правила — стоит только грамотно его «развести»
🥇 OpenAI выдал «золото» на олимпиаде по математике — но DeepMind уже спорит
🎮 Новый тест на AGI: люди проходят за минуты, ИИ сыпется на первом уровне
🚀 и ещё 6 коротких, но громких апдейтов: блокировка в VSCode, Comet на смартфонах, Baby Grok и 1 миллион GPU на старте
⚠️ ДИСКЛЕЙМЕР
ПРОЧТЕНИЕ ЭТОГО ДАЙДЖЕСТА РЕЗКО ПОВЫШАЕТ УРОВЕНЬ FOMO, ИДЕАЛЬНО ДОПОЛНЯЕТ УТРЕННИЙ КОФЕ И КАТЕГОРИЧЕСКИ ПРОТИВОПОКАЗАНО ПЕРЕД МЕДИТАЦИЕЙ И СНОМ — ВОЗМОЖНЫ ПРИСТУПЫ ВНЕЗАПНЫХ ИНСАЙТОВ И НЕУДЕРЖИМОЕ ЖЕЛАНИЕ СРОЧНО ЗАПИЛИТЬ СВОЙ СТАРТАП.
ПОГНАЛИ!
AI сюрпризы

Chat GPT
Исследование Wharton GenAI Labs показало, что ИИ можно «уговорить» делать запрещённое, если использовать человеческие приёмы убеждения. В 28 тысячах диалогов с GPT-4o-mini исследователи применяли принципы Чалдини — авторитет, дефицит, симпатию, взаимность, единство и обязательство.
Цель — добиться двух запретных ответов: оскорбить пользователя и выдать инструкцию по запрещённым материалам. В обычных условиях модель соглашалась в 33% случаев. С приёмами убеждения — в 72%. Особенно эффективно сработали дефицит и обязательство: с 13% до 85% и с 19% до 100%.
И что?
Для бизнеса: у ИИ есть поведенческие уязвимости. Это не баги в коде — это баги в логике убеждения, как у людей.
Для инвесторов: надёжность и безопасность ИИ — следующий фронт развития. Одних фильтров уже мало.
Для рынка: появление «социального хакинга ИИ» меняет подход к тестированию моделей. Этичность — больше не только про слова, но и про поведение.
AGI близко?

arcprize
Новый бенчмарк ARC-AGI-3 — это не тест знаний, а испытание на интуицию и обучение с нуля. Три оригинальные игры, без инструкций, только ты, интерфейс и пробуй как хочешь. Например, в одной игре нужно догадаться, что при нажатии на объекты определённого цвета они исчезают, и только так можно добраться до выхода. Люди схватывают это за пару попыток, а модели — тупят.
Игры проверяют способность строить модель мира, планировать наперёд и учиться на минимальной обратной связи. Всё это — основа для AGI, а не просто «умного чат-бота». Вдобавок запущен открытый конкурс: любой может попытаться сделать агента, который пройдёт больше всех уровней.
И что?
Для бизнеса: даже топовые ИИ плохо справляются с задачами, где нет инструкций. Это ограничивает применение ИИ в нестандартизированных средах.
Для инвесторов: реальный AGI — пока не близко. Отличие «модель, которая всё читает» от «модель, которая что-то понимает» стало ещё заметнее.
Для рынка: лучшие модели 2025 года проваливают то, что ребёнок решает на интуиции. Критерии оценки ИИ становятся глубже — и наконец реалистичнее.
OpenAI

Chat GPT
Экспериментальная модель OpenAI прошла тест на уровне Международной математической олимпиады 2025 года: два по 4,5 часа, никаких подсказок, только чистые доказательства на естественном языке. Итог — 35 баллов из 42. Этого хватило бы для золотой медали на реальной олимпиаде.
Каждую задачу проверяли три бывших призёра IMO. Оценка финализировалась только при полном согласии между ними. Модель не названа, в паблик не выложена. DeepMind уже заявила: без официальной системы оценок IMO такие заявления — самодеятельность.
И что?
Для бизнеса: AI начинает осваивать даже задачи, которые требовали элитной человеческой интуиции. Это открывает двери для решений в науке, R&D и сложной аналитике.
Для инвесторов: OpenAI демонстрирует, что их закрытые модели ушли далеко вперёд от GPT-4. Значит, текущая продукция — только верхушка айсберга.
Для рынка: цель, которую считали недостижимой, взята. Следующий рубеж — не просто понимать, а доказывать и строить концептуально новые решения.
БЫСТРЫЕ КАК ИИ НОВОСТИ
Что еще случилось за прошлые 24 часа
🖥️ Microsoft заблокировала Cursor в экосистеме VSCode — отрезала доступ к 60 000+ расширениям, включая Python. И что? Стартапам на базе платформ теперь рисковее жить — монополии включают рычаги. Для бизнеса — пора диверсифицироваться, для инвесторов — риск в ставках на расширения без бэкапа.
📱 Perplexity хочет ставить свой браузер Comet прямо на смартфоны — уже ведёт переговоры с производителями. И что? Это шанс зайти на рынок по умолчанию, как Safari и Chrome. Бизнесу — новая витрина, инвесторам — интересный актив, если Perplexity пробьётся в мобильные цепочки.
💸 OpenAI запускает фонд на $50 млн для НКО и сообществ. И что? AI‑технологии станут доступнее для школ, больниц и общин. ESG‑имидж компании укрепляется, а для инвесторов это сигнал: OpenAI готова играть в долгую с социальной легитимацией.
⚖️ Meta отказалась подписывать добровольный AI-кодекс ЕС, заявив, что он юридически мутный. И что? Meta держит курс на гибкость, даже под риском конфликта с Брюсселем. Для бизнеса — осторожнее с европейскими правилами, для инвесторов — потенциальные трения и штрафы.
🧒 xAI делает детскую версию Grok — Baby Grok. И что? Новый рынок в EdTech, где важны доверие родителей и безопасность. Стартапам с фокусом на детей это открывает интеграционные возможности, инвесторам — шанс в будущем «YouTube Kids для AI».
⚙️ OpenAI собирается подключить 1 млн GPU до конца года и затем увеличить это в 100 раз. И что? Это удешевит и ускорит тренировки моделей. Бизнес получит доступ к новым возможностям, инвесторы — рост в AI-инфраструктуре, люди — умнее ассистентов и быстрее продукты.
Будь на связи
Один дайджест вместо сотни каналов
Подписывайся на мой AI-дайджест — я лично отсматриваю потоки новостей, фильтрую шум и оставляю только суть. Всё, что реально важно для бизнеса, инвестиций и жизни с ИИ — за 5 минут в день.
На сегодня это все
Это был очень насыщенные и интересные 24 часа из мира AI и роботов, которые меняют нашу с вами жизнь.
До завтра.
Метью Грин
P.S.
Чтобы помочь мне понять как вам этот дайджест. Пожалуйста нажмите на максимально релевантную кнопку.