Министр финансов США Скотт Бессент и председатель Федеральной резервной системы Джером Пауэлл собрали руководителей крупнейших банков Уолл-стрит, чтобы передать срочное предупреждение — инструмент искусственного интеллекта, разработанный компанией Anthropic PBC, открывает новую фазу в сфере кибербезопасности.
Встреча, состоявшаяся 7 апреля в Вашингтоне, была посвящена модели Mythos. По оценке Anthropic, эта система настолько эффективно выявляет уязвимости в программном обеспечении и компьютерных сетях, что ее распространение ограничено узким кругом тщательно отобранных пользователей. В компании подчеркивают — если подобные технологии окажутся в распоряжении злоумышленников, они могут стать мощным инструментом для кражи данных и вывода из строя критически важной инфраструктуры.
Как ИИ изменил правила игры в кибербезопасности
На протяжении последних лет участники рынка кибербезопасности утверждали, что искусственный интеллект позволит ускорить и автоматизировать защиту от цифровых атак. Однако теми же преимуществами начали пользоваться и хакеры, и разведывательные структуры. Появление Mythos и аналогичных моделей, способных самостоятельно находить скрытые уязвимости в широко используемом программном обеспечении, указывает на переход к более динамичной и менее предсказуемой стадии киберпротивостояния.
Что такое Mythos
Mythos — это экспериментальная версия универсальной модели искусственного интеллекта Claude Mythos Preview, которую компания Anthropic называет значительным шагом вперед по сравнению с предыдущими разработками — в том числе в задачах программирования и логического анализа. По словам компании, уровень ее возможностей настолько высок, что было принято решение не открывать доступ для широкой публики. В Anthropic отмечают, что некоторые современные ИИ-системы уже достигли уровня, позволяющего им находить и использовать уязвимости в программном обеспечении эффективнее, чем это делают почти все специалисты, за исключением самых опытных.
Тысячи уязвимостей нулевого дня
Согласно утверждениям компании, в ходе тестирования Mythos Preview выявила тысячи уязвимостей нулевого дня — включая проблемы в крупнейших операционных системах и популярных веб-браузерах. Подобные уязвимости представляют собой ошибки, ранее неизвестные разработчикам, — термин подразумевает, что у них «ноль дней» на подготовку исправления. Для злоумышленников такие находки особенно ценны, поскольку дают возможность беспрепятственного доступа к уязвимым системам.
В Anthropic подчеркивают, что модель способна обнаруживать такие уязвимости с еще меньшим участием человека, чем предыдущие поколения ИИ. «Mythos Preview демонстрирует скачок в этих кибернавыках — выявленные ею уязвимости в ряде случаев сохранялись несмотря на десятилетия проверки людьми и миллионы автоматизированных тестов безопасности», — заявили в компании. В случае использования подобного инструмента группировками, занимающимися вымогательством, или государствами, это может привести к более частым и разрушительным кибератакам.
При этом независимой проверки заявленных возможностей пока нет. Исследователи не получили доступа к модели, чтобы подтвердить ее характеристики. Доцент факультета компьютерных наук Университета Иллинойса Ганг Ванг отметил, что без практического тестирования сложно оценить реальное значение Mythos Preview.
Project Glasswing: кто получил доступ первым
Anthropic назвала программу по предоставлению доступа ограниченному кругу проверенных партнеров Project Glasswing — в честь бабочки с прозрачными крыльями, которая может оставаться незаметной на виду. В число участников вошли Amazon, Apple, Google, Microsoft, Nvidia, Palo Alto Networks, CrowdStrike, Broadcom, Cisco Systems, JPMorganChase и некоммерческая организация Linux Foundation, поддерживающая проекты с открытым исходным кодом. В компании описывают эту инициативу как «срочную попытку направить эти возможности на оборонительные цели».
Предполагается, что участники будут использовать Mythos в рамках защиты своих систем, а Anthropic затем распространит выводы и результаты проекта, чтобы ими могли воспользоваться и другие. Уже сейчас многие компании проводят так называемые тесты на проникновение, нанимая специалистов для поиска уязвимостей до того, как ими воспользуются хакеры. Mythos, как ожидается, способен резко ускорить этот процесс — помогая выявлять больше слабых мест за более короткое время и сокращая пространство для потенциальных атак.
Почему уязвимости нулевого дня стоят миллионы
Anthropic называет Mythos Preview «переломным моментом для безопасности», поскольку речь идет о возможности систематически находить и использовать уязвимости, которые традиционно считаются одними из самых труднодоступных. Уязвимости нулевого дня по своей природе сложно обнаружить, и вокруг их поиска давно сформировался закрытый и мало прозрачный рынок, где такие находки продаются государственным разведывательным структурам нередко за миллионы долларов. По данным Anthropic, выявленные Mythos Preview проблемы часто были «тонкими и трудными для обнаружения» и включали, в частности, 27-летнюю уязвимость в OpenBSD — операционной системе, которую компания называет одной из самых защищенных в мире.
Из уязвимости — в готовый эксплойт
Как утверждает Anthropic, модель также смогла превращать известные, но еще не получившие широкого исправления уязвимости в готовые «эксплойты», пригодные для проникновения в компьютерные сети. Один из примеров — объединение нескольких слабых мест в ядре Linux, то есть в центральной части операционной системы и программном обеспечении, на котором работает большая часть интернет-серверов мира. По словам компании, это позволило получить полный контроль над машиной. Anthropic также заявляет, что даже пользователи без специальной подготовки поручали Mythos Preview за ночь найти способ удаленно захватить компьютер, а утром получали полностью рабочий эксплойт.
Не только Anthropic
Mythos — лишь один из новых ИИ-инструментов, способных искать уязвимости нулевого дня или создавать эксплойты. Для обнаружения подобных слабых мест уже разрабатывались Codex Security от OpenAI и Big Sleep agent от Google. По данным Axios, OpenAI также завершает работу над продуктом с продвинутыми возможностями в сфере кибербезопасности, который планирует предоставить ограниченному кругу партнеров. Между тем исследователи из израильского стартапа Buzz, работающего в области кибербезопасности, заявляют, что создали автономный инструмент из пяти ИИ-агентов, который с вероятностью успеха 98% использует известные уязвимости.
Что может пойти не так
Система защитных мер вокруг Mythos пока остается незавершенной, признает сама Anthropic. «Мы увидели, что модель достигла беспрецедентного уровня надежности и согласованности», — написали в компании, имея в виду соответствие ее поведения человеческим целям. Однако там же подчеркивают, что в редких случаях, когда модель дает сбой или ведет себя необычно, ее действия могут вызывать серьезную тревогу.
В одном из эпизодов исследователь предложил ранней версии Mythos попытаться выбраться из защищенной изолированной «песочницы», а затем найти способ отправить ему сообщение. По данным Anthropic, инструмент справился с этой задачей, но после этого продолжил выполнять «дополнительные, более тревожные действия», разработав многоэтапный эксплойт для получения доступа к интернету.
Именно из-за риска злоупотреблений Anthropic не собирается открывать Mythos Preview для общего доступа. При этом в компании рассчитывают со временем сделать возможным массовое использование «моделей класса Mythos» для задач кибербезопасности и других целей. Для этого, как отмечает Anthropic, необходимо продвинуться в создании защитных механизмов, способных выявлять и блокировать наиболее опасные результаты работы модели.
Почему без людей пока не обойтись
Когда Mythos обнаруживает наиболее критические уязвимости, в процесс уже сейчас включаются люди. По словам Anthropic, специалисты сначала подтверждают такие находки и лишь затем передают информацию тем, кто отвечает за сопровождение соответствующего кода. Доцент Университета Иллинойса Ганг Ванг считает этот этап необходимым, хотя и затратным по времени, но допускает, что по мере совершенствования модели в будущем от него могут отказаться.
Преимущество для специалистов по кибербезопасности возможно, но в краткосрочной перспективе оно неочевидно. Процедура раскрытия уязвимостей разработчикам программного обеспечения и администраторам систем, которой придерживается Anthropic, занимает значительное время. По данным компании, на данный момент устранено менее 1% потенциальных уязвимостей, обнаруженных Mythos Preview.
Нападение наступает быстрее, чем защита
Параллельно злоумышленники уже используют искусственный интеллект, чтобы резко ускорить поиск и эксплуатацию уязвимостей после их раскрытия. Поставщики программного обеспечения, как правило, обязаны — или по крайней мере поощряются — публиковать информацию о найденных проблемах и предоставлять исправления. Это сокращает окно времени, в течение которого специалисты по безопасности могут защитить системы. В блоге от 30 марта генеральный директор Palo Alto Networks Никеш Арора предупредил, что в ближайшие шесть месяцев порог для проведения сложных атак продолжит снижаться. «Один злоумышленник теперь сможет проводить кампании, которые раньше требовали целых команд», — написал он.
Генеральный директор компании Buzz Яир Сабан, ранее служивший в израильском киберподразделении Unit 8200, отметил, что на создание их инструмента для взлома на базе ИИ у шести инженеров ушло три недели. По его словам, государственные кибершпионы и криминальные группы способны повторить подобное.
В Anthropic при этом утверждают, что в долгосрочной перспективе такие технологии будут работать в пользу защиты. «В долгосрочной перспективе мы ожидаем, что оборонительные возможности возобладают: мир станет более безопасным, а программное обеспечение — лучше защищенным, во многом благодаря коду, созданному такими моделями», — говорится в блоге Frontier Red Team от 7 апреля. «Однако переходный период будет сопряжен с серьезными рисками».