Впервые в России проведено масштабное исследование возможностей ИИ-моделей в сфере экологии и устойчивого развития. Совместная работа НИУ ВШЭ и Росприроднадзора показала, насколько точно нейросети могут отвечать на вопросы, связанные с экологическим законодательством.
Источник фото: avatars.mds.yandex.net
В ходе исследования тестировались шесть общедоступных языковых моделей. Лучшие результаты показал Grok AI, следом расположились китайские Qwen и DeepSeek. Российские Yandex GPT и GigaChat заняли четвертое и пятое места соответственно.
Источник фото: spb.hse.ru
Для оценки использовали 81 вопрос разной сложности — от простых до требующих развернутого анализа. Ответы моделей сравнивали с экспертными заключениями специалистов Росприроднадзора. Важным критерием была не только правильность, но и полнота информации.
Как отметил руководитель исследования Максим Сторчевой, все модели допускали ошибки, поэтому полностью полагаться на них нельзя. Однако ИИ уже сейчас может помогать в подготовке экологической отчётности, консультировании по законодательству и разработке ESG-стратегий.
По словам замруководителя Росприроднадзора Владимира Чернышева, внедрение таких технологий позволит оперативнее обрабатывать обращения граждан — только в 2023 году в ведомство поступило более 8,2 тыс. жалоб, половина из которых касалась загрязнения окружающей среды.
Планируется, что рейтинг будет обновляться каждые полгода с учетом появления новых моделей и изменений в законодательстве. Следующая оценка запланирована на ноябрь 2025 года. Результаты исследования помогут бизнесу и госорганам в выборе ИИ-решений для экологического менеджмента.