Не секрет, что очень много контента в интернет написано с использованием ChatGPT и альтернативных разработок на базе искусственного интеллекта (AI). Можно ли отличить то, что написано человеком, о того, что написано машиной?
В этой статье я перечислю самые верные признаки, которое должны указывать на сгенерированный при помощи ИИ текст, а также расскажу про 7 самых популярных бесплатных онлайн сервисов детекторов ChatGPT, Bing AI, Google Bard и пр.
Основные признаки сгенерированного AI текста
Я попросил ChatGPT перечислить самые яркие признаки того, что текст сгенерирован AI, и вот какой ответ он дал:
- Чрезмерно формальный язык. AI имеет тенденцию создавать текст, который хотя и является грамматически выверенным (модели ИИ обучаются на больших наборах данных с правильной грамматикой и орфографией), но может выглядеть чересчур формально. Признаками генерёнки могут быть неестественные фразы или отсутствие шаблонов разговорного языка.
- Недостаток конкретных знаний. Каждая языковая модель обучается на данных, имеющихся до какой-то даты. Например, знания GPT 3,5 ограничены сведениями вплоть до Сентября 2021 г. Если тексту не хватает сведений о последних событиях, можно предположить, что он создан искусственным интеллектом.
- Частые противоречивые утверждения. ChatGPT может предоставлять по запросу непоследовательную или противоречивую информацию. Несоответствия в естественной человеческой речи встречаются реже, поэтому частые противоречия могут быть признаком текста, сгенерированного ИИ.
- Отсутствие эмоционального понимания. Нейросети на данном этапе плохо понимают и выражают эмоции. Они могут давать общие ответы там, где требуется какая-то эмоциональная окраска.
- Отсутствие личного или субъективного опыта. В тексте, сгенерированном AI, часто отсутствует личное отношение к предмету, субъективная точка зрения, которую люди обычно включают в свои тексты. Зачастую это приводит к довольно общим ответам, которые не отражают глубокого понимания конкретного вопроса.
- Необычные сочетания слов. Сгенерированные фразы и предложения часто выглядят для человека необычно из-за редкого или нетрадиционного выбора и сочетания слов. Также нередко встречается повторяющееся использование определенных фраз, выражений или языковых шаблонов в течение небольшого по объему текста, что свидетельствует об отсутствии разнообразия и творчества.
- Отсутствие культурных отсылок. Сгенерированный текст может демонстрировать ограниченное понимание или использование культурных отсылок, идиом, сленга или текущих тенденций, которые обычно используют люди как в устной, так и в письменной речи.
Важно отметить, что эти признаки следует рассматривать в совокупности, поскольку ни один из перечисленных выше индикаторов в отдельности не может окончательно свидетельствовать о том, что текст был создан при помощи AI. И вот тут на помощь придут те самые детекторы AI, которые с высокой долей вероятности подскажут сгенерирован ли конкретный текст при помощи ChatGPT, Jasper и альтернативных разработок.
Лучшие бесплатные AI детекторы
Copyleaks AI Content Detector
Copyleaks является первым в своем роде сервисом, который обнаруживает генерёнку на многих языках, включая английский, русский, польский, немецкий и пр. Определяет контент, созданный с помощью ChatGPT, GPT-4, GPT-3, Jasper и других языковых моделей.
Среди прочих особенностей:
- Легко интегрируется с некоторыми из самых популярных систем управления обучением (LMS).
- Функция проверки на плагиат.
- Есть расширение для Chrome, что значительно повышает удобство работы с ним в браузерах.
Поддержка русского языка: есть.
AI Text Classifier
Данный сервис представлен разработчиком самой языковой модели ChatGPT. Чтобы результат проверки был максимально точный, нужно использовать текст как минимум 1 тыс. символов (150-200 слов).
По признанию самих же разработчиков, AI Text Classifier с высокой долей вероятности ошибется в своей оценке в тексте, написанном детьми, и в тексте не на английском языке, потому что его алгоритм был в первую очередь обучен на базе английского контента, написанного взрослыми людьми.
Данный сервис не дает числовых оценок вероятности генерёнки, но вместо них дает описательные (вероятно, маловероятно и пр.)
Поддержка русского языка: есть.
ContentAtScale Chat GPT Detector
Полностью бесплатный сервис определения текста, написанного ИИ. Для более-менее точного результата требует введения не менее 25 слов. Алгоритм сервиса использует в работе сочетание трех движков искусственного интеллекта, алгоритмов NLP и семантического анализа, а также парсинг поисковой выдачи Google.
Разработчики ContentAtScale заявляют об уникальности своего сервиса, поскольку он основан на самых передовых разработках.
Поддержка русского языка: есть.
Winston AI Detection
Данный сервис был создан главным образом для преподавателей и является, по признаниям многих, одним из лучших для проверки того, был ли текст написан самим студентом или создан им при помощи ИИ.
Основные характеристики Winston AI Detection:
- Работает со всеми версиями ChatGPT, включая GPT-4.
- Алгоритм сервиса также обнаруживает плагиат и предоставляет список повторяющихся текстов, найденных в Интернет.
- Бесплатно можно отправить для проверки не более 2 тыс. слов.
- Можно загружать файлы Word, PDF, а также нераспознанные сканы или фотографии документов.
Поддержка русского языка: нет.
GPTZero
Довольно популярный сервис, имеющий аудиторию свыше миллиона пользователей. Поскольку его алгоритм был обучен на большом объеме текста, написанного человеком, куда вошли написанные студентами статьи, новостные и научные публикации по дисциплинам в области естественных и гуманитарных наук, то GPTZero считается одним из лучших именно для преподавателей.
Особенности GPTZero:
- Проверка на AI бесплатна, платная версия также предлагает средство проверки на плагиат.
- Использует уникальные маркеры сгенерированного текста (perplexity и burstiness).
- Можно анализировать файлы pdf, docx, txt.
Поддержка русского языка: есть.
Originality.AI
Originality.ai работает как в виде самостоятельного онлайн сервиса, так и в виде расширения для Хрома и всех браузеров на том же движке. После регистрации вы получите 50 кредитов — этого хватит для пятидесяти бесплатных проверок на генеренку. Потом придется раскошелиться на $0,01 за 100 слов.
Есть функция проверки на плагиат. Работает с языковыми моделями GPT-2, GPT-3, GPT-NEO, GPT-J, ChatGPT, GPT 3.5 и GPT 4.
По отзывам пользователей, данный детектор является одним из самых точных при обнаружении как текстов, написанных AI, так и текстов, написанных человеком. Идеально подходит тем, кто работает с копирайтерами и заказывает статьи для сайтов.
Поддержка русского языка: есть.
Writer’s AI Content Detector
Бесплатный инструмент проверки сгенерированного контента. За раз принимает до 1500 символов текста.
Уникальной особенностью данного сервиса является то, что вы можете вставлять как сам текст , так и указывать URL для анализа.
Поддержка русского языка: нет.
Какой из AI-детекторов лучше?
Все перечисленные выше онлайн сервисы хорошо справляются с задачей определения контента, созданного в ChatGPT и других нейросетях. Выбирать стоит, пожалуй, лишь по удобству пользования, возможности загрузки документов, отправки URL и пр.
Все сервисы-детекторы гарантируют высокий процент достоверности анализа и смело заявляют, что смогут отличить текст, написанный человеком, от текста, написанного нейросетью, с достоверностью от 90 до 99,1%. На мой взгляд, это слишком смелое заявление 🙂 Интересно было бы изучить как данные сервисы проявят себя на конкретных примерах и какой результат покажут на самом деле. Поэтому предлагаю следующее…
Если вам тоже был бы интересен такой эксперимент, напишите об этом в комментариях и поделитесь данной статьёй в социальных сетях или Телеграм. Если я увижу, что комментариев к статье наберется хотя бы 10-15 штук (и число лайков меня тоже вдохновит), то я проведу большое тестирование перечисленных в статье детекторов AI-контента и напишу по его результатам отдельную статью. Тогда все точки над i будут расставлены.