Рост числа текстов, созданных искусственным интеллектом после запуска ChatGPT, похоже, замедлился. Новое исследование показывает, что доля материалов, написанных преимущественно ИИ, уже более года остается примерно на одном уровне, а опасения о полном вытеснении человеческого контента пока не оправдались.
Согласно анализу маркетингового агентства Graphite, около половины новых онлайн-статей, блогов и материалов в формате listicle сейчас создаются в основном с использованием ИИ. Однако с начала 2025 года этот показатель практически не растет.
Человек vs ИИ: доля текстов в выборке из 55 400 англоязычных URL
100% 80 60 40 20 0 2020 2021 2022 2023 2024 2025 2026 человек ИИ 50% 50%
Поквартальные данные, 2020–2026
Исследователи считают это важным сигналом на фоне опасений, что интернет может превратиться в замкнутую систему, где нейросети обучаются преимущественно на текстах, созданных другими нейросетями.
«Эти модели умны благодаря информации, которую люди размещали в интернете без участия таких моделей», — заявил Axios профессор Калифорнийского университета в Беркли Дэн Кляйн. «Если мы перестанем создавать знания независимо от ИИ, то что будет подпитывать сами модели?»
По данным Graphite, уже через год после запуска ChatGPT в ноябре 2022 года доля преимущественно ИИ-сгенерированных статей достигла 35,9 процента. Через два года показатель вырос до 48 процентов. Однако затем рост практически остановился, и с начала 2025 года доля подобных материалов держится около половины всех новых публикаций.
Для исследования Graphite случайным образом отобрало 55,4 тысячи англоязычных страниц из архива Common Crawl — одного из крупнейших открытых хранилищ данных интернета, которое часто используется для обучения ИИ-моделей.
В выборку вошли материалы объемом не менее 100 слов, опубликованные с января 2020 по март 2026 года и классифицированные как статьи или listicle. Затем тексты проверяли с помощью сервисов Pangram, GPTZero и Copyleaks, предназначенных для выявления ИИ-контента.
Авторы исследования признают, что определить происхождение текста становится все сложнее. Во многих случаях материалы создаются совместно человеком и ИИ: алгоритмы используются для подготовки структуры, черновиков, редактирования или переписывания текста.
Graphite относило материал к преимущественно ИИ-сгенерированным только в случаях, когда большая часть текста определялась как написанная или существенно переработанная искусственным интеллектом.
В исследовании также отмечается, что качество ИИ-контента быстро растет.
«Во многих случаях тексты, созданные ИИ, уже не хуже или даже лучше материалов, написанных людьми. Часто людям трудно определить, был ли текст создан человеком или искусственным интеллектом», — говорится в отчете.
Авторы исследования делают вывод, что сейчас ИИ создает примерно столько же материалов, сколько и люди, однако дальнейшее доминирование машинного контента пока не наблюдается.