Зелёный камуфляж: Как распознать ложные заявления об устойчивом развитии

Автор: Денис Аветисян

Новая система EmeraldMind использует знания о принципах устойчивого развития, чтобы выявлять недобросовестные практики в экологической рекламе и отчетах компаний.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал

На представленном фрагменте графа знаний EmeraldGraph, центрированного вокруг анонимизированной компании, узлы, представляющие инициативы, местоположения, материалы, продукты, цели, заявления об устойчивом развитии, организации, предприятия и ключевые показатели эффективности, кодируются цветом для наглядности структуры взаимосвязей.

Представлен фреймворк EmeraldMind, основанный на графах знаний и механизмах расширенной генерации, для повышения точности и обоснованности выявления гринвошинга.

В условиях растущего внимания к устойчивому развитию, достоверность корпоративных заявлений об экологической ответственности становится критически важной, однако существующие системы часто не способны выявлять случаи гринвошинга. В данной работе представлена система ‘EmeraldMind: A Knowledge Graph-Augmented Framework for Greenwashing Detection’, использующая специализированный граф знаний и механизм расширенной генерации для автоматического обнаружения вводящих в заблуждение заявлений об устойчивом развитии. Эксперименты показали, что предложенный подход демонстрирует высокую точность, расширенный охват и превосходное качество объяснений, превосходя базовые модели без необходимости дополнительного обучения. Способна ли EmeraldMind стать надежным инструментом для обеспечения прозрачности и ответственности в сфере ESG-отчетности?

Растущая Неопределенность: Гринвошинг и Сложность ESG-Отчетности

В последнее время отчеты компаний об экологическом, социальном и управленческом воздействии (ESG) подвергаются все более пристальному вниманию, что связано с растущей проблемой “гринвошинга” — практики представления ложной или вводящей в заблуждение информации о своей экологической ответственности. Компании, стремясь привлечь инвесторов и улучшить свою репутацию, зачастую преувеличивают свои достижения в области устойчивого развития или скрывают негативные аспекты своей деятельности. Это создает значительные риски для инвесторов, которые полагаются на эти отчеты при принятии решений, а также подрывает доверие к концепции устойчивого развития в целом. В результате, наблюдается усиление требований к прозрачности и достоверности ESG-отчетности со стороны регулирующих органов и заинтересованных сторон, что требует от компаний более ответственного подхода к раскрытию информации и подтверждения своих заявлений.

Современные методы проверки информации, содержащейся в отчетах по ESG (экологическим, социальным и управленческим факторам), сталкиваются со значительными трудностями из-за огромного объема данных и их возрастающей сложности. Традиционные подходы, основанные на ручном анализе и выборочных проверках, попросту не справляются с потоком информации, что делает выявление случаев “гринвошинга” — ложной или преувеличенной экологической ответственности — крайне затруднительным. Сложность заключается не только в объеме, но и в разнообразии используемых показателей, методологий и стандартов отчетности, что требует глубокой экспертизы и значительных временных затрат. В результате, достоверность представленных данных часто остается под вопросом, что подрывает доверие к принципам устойчивого развития и создает риски для инвесторов и заинтересованных сторон.

Новые нормативные акты, такие как SFDR и CSRD, предъявляют значительно более высокие требования к прозрачности экологического, социального и управленческого (ESG) раскрытия информации компаниями. Это привело к резкому увеличению объема публикуемых данных, что делает традиционные методы проверки и анализа практически невозможными. В связи с этим, возрастает потребность в автоматизированных системах верификации, способных эффективно обрабатывать большие объемы данных, выявлять несоответствия и обеспечивать достоверность ESG-отчетности. Автоматизация позволяет не только соответствовать ужесточающимся регуляторным требованиям, но и повысить доверие инвесторов и заинтересованных сторон к информации об устойчивом развитии компаний, что, в свою очередь, способствует более эффективному распределению капитала в направлении экологически и социально ответственных проектов.

Создание Фундамента Знаний: EmeraldGraph и Источники Данных

В основе нашего решения лежит EmeraldGraph — графовая база данных (Knowledge Graph), предназначенная для структурированного представления данных об организациях, связанных с принципами ESG (экология, социальная ответственность и управление), а также взаимосвязями между ними. EmeraldGraph позволяет моделировать сложные отношения между сущностями, такими как компании, их продукты, географические локации, регуляторные требования и связанные риски. Данная структура обеспечивает возможность эффективного анализа и поиска информации, необходимой для оценки ESG-показателей и принятия обоснованных инвестиционных решений. Графовая модель данных позволяет не только хранить информацию, но и выявлять скрытые закономерности и взаимосвязи, которые невозможно обнаружить при использовании традиционных реляционных баз данных.

Извлечение схемы является ключевым процессом для преобразования неструктурированных данных ESG в структурированный формат, пригодный для наполнения графа знаний. Неструктурированные данные, такие как текстовые отчеты о корпоративной социальной ответственности и экологической устойчивости, не могут быть напрямую использованы для анализа или построения взаимосвязей. Извлечение схемы включает в себя автоматическое определение ключевых сущностей, их атрибутов и взаимосвязей в этих текстах. Этот процесс использует методы обработки естественного языка (NLP) и машинного обучения для идентификации и категоризации информации, позволяя преобразовать её в структурированные данные, соответствующие определенной онтологии и пригодные для импорта в граф знаний, такой как EmeraldGraph. Точность и полнота извлечения схемы напрямую влияют на качество и полезность данных, хранящихся в графе знаний.

База знаний формируется из различных источников, включая необработанный ESG-текст, хранящийся в базе данных EmeraldDB, и эталонные наборы данных, такие как EmeraldData. На данный момент EmeraldData представляет собой граф знаний, состоящий из 53 748 сущностей и 59 344 взаимосвязей между ними. Эта структура позволяет эффективно агрегировать и анализировать данные ESG из различных источников, обеспечивая целостность и доступность информации.

Для обеспечения согласованного представления данных в Knowledge Graph используются стандартизированные словари онтологий, в частности, OntoSustain. Эта онтология, а также связанные с ней графы знаний, такие как SustainGraph и KnowUREnvironment, предоставляют унифицированную терминологию для описания сущностей и взаимосвязей в области ESG (Environmental, Social, and Governance). Применение этих стандартизированных словарей позволяет избежать неоднозначности в интерпретации данных, упрощает интеграцию данных из различных источников и обеспечивает совместимость данных внутри Knowledge Graph, что критически важно для анализа и построения корректных выводов.

Схема EmeraldGraph определяет структуру данных для представления графов с расширенными возможностями.

Автоматизированная Верификация с EmeraldMind: RAG и Фактологическая Проверка

EmeraldMind представляет собой специализированную систему извлечения информации (RAG), использующую большие языковые модели (LLM) для выявления потенциально вводящих в заблуждение утверждений в отчетах об экологическом, социальном и корпоративном управлении (ESG). Фреймворк предназначен для автоматизированного анализа текстов ESG-отчетности с целью обнаружения неточностей или несоответствий заявленным данным. Основной принцип работы заключается в поиске и сопоставлении утверждений, содержащихся в отчете, с внешними источниками информации и данными, что позволяет оценить их достоверность и объективность. Специализация системы на ESG-домене позволяет достичь более высокой точности и релевантности результатов по сравнению с универсальными LLM.

В основе работы системы лежит использование структурированных данных, хранящихся в EmeraldGraph. Этот граф знаний служит источником релевантных доказательств, необходимых для проверки утверждений, содержащихся в ESG-отчетах. Система извлекает из EmeraldGraph информацию, которая может подтверждать или опровергать каждое конкретное утверждение, обеспечивая тем самым возможность автоматизированной верификации. Использование структурированных данных позволяет системе эффективно находить и сопоставлять информацию, в отличие от неструктурированного поиска по текстовым документам, что повышает точность и надежность процесса проверки.

Проверка фактов в системе осуществляется путем сопоставления утверждений из отчетов с извлеченными подтверждающими или опровергающими доказательствами. Данный процесс обеспечивает автоматическую верификацию и достиг общей точности 70.59% на наборе данных GreenClaims при использовании few-shot prompting. Это означает, что система способна с высокой долей вероятности определять достоверность экологических заявлений, основываясь на предоставленных данных, даже при ограниченном количестве примеров для обучения.

Использование подхода RAG (Retrieval-Augmented Generation) в системе EmeraldMind, основанного на структурированной базе знаний EmeraldGraph, значительно повышает точность и надежность генерируемых пояснений. Проведенные тесты на датасете EmeraldData продемонстрировали покрытие от 62% до 77% релевантной информации, что подтверждает эффективность использования структурированных данных для улучшения качества ответов и снижения вероятности галлюцинаций, характерных для больших языковых моделей. Данный показатель отражает способность системы предоставлять обоснованные и подтвержденные фактами объяснения на основе анализа данных, содержащихся в EmeraldGraph.

EmeraldMindFramework представляет собой платформу для разработки и обучения агентов искусственного интеллекта.

К Ответственному Искусственному Интеллекту: Объяснимые и Надежные Выводы

Обоснованные фактическими данными объяснения играют ключевую роль в формировании доверия к автоматизированным системам верификации. Отсутствие прозрачности в работе таких систем может вызывать обоснованные опасения относительно их надежности и справедливости. Предоставление четких, подтвержденных доказательствами обоснований для каждого вывода позволяет пользователям понять, как система пришла к определенному решению, и оценить ее обоснованность. Это особенно важно в областях, где решения автоматизированных систем могут иметь значительные последствия, например, в финансовом секторе или в сфере здравоохранения. Чем более полными и понятными являются объяснения, тем выше вероятность того, что пользователи будут доверять системе и принимать ее решения.

Для оценки качества предоставляемых объяснений, необходимых для построения доверия к автоматизированным системам верификации, используется метрика ILORA. Исследования показывают, что система, использующая ILORA, последовательно демонстрирует более высокие баллы по всем пяти оцениваемым аспектам — полноте, ясности, логичности, релевантности и убедительности — по сравнению с базовыми методами. Такой подход позволяет не просто констатировать наличие или отсутствие проблем, но и предоставлять детальные, обоснованные и всесторонние объяснения, что существенно повышает надежность и прозрачность принимаемых решений и способствует более эффективному контролю качества.

Внедрение принципов ответственного искусственного интеллекта позволяет выйти за рамки простого обнаружения проблем и перейти к предоставлению действенных рекомендаций для заинтересованных сторон. Вместо констатации факта нарушения принципов устойчивого развития, система способна предложить конкретные шаги для улучшения ситуации, что значительно повышает ценность анализа. Такой подход позволяет не только выявить несоответствия в корпоративной отчетности, но и предоставить информацию, необходимую для принятия обоснованных решений и повышения прозрачности деятельности компании. Это способствует укреплению доверия со стороны инвесторов, потребителей и регулирующих органов, а также позволяет организациям демонстрировать свою приверженность принципам устойчивого развития на практике.

Подход, основанный на принципах ответственного искусственного интеллекта, значительно повышает прозрачность и подотчетность в корпоративной отчетности об устойчивом развитии. Результаты оценки по методу Борда демонстрируют явное предпочтение обоснований, предоставляемых моделью EM-RAG, что указывает на её превосходство над EM-KGRAG и базовыми методами. Данное превосходство подтверждается не только качеством объяснений, но и общей эффективностью системы в предоставлении убедительных и логически выстроенных аргументов, способствующих более глубокому пониманию и доверию к отчётности об устойчивом развитии со стороны заинтересованных сторон.

Оценка ILORA различных комбинаций запросов и конвейеров показывает различия в качестве, оцениваемом по пятибалльной шкале, где 1 соответствует наихудшему, а 5 - наилучшему результату. — Оценка ILORA различных комбинаций запросов и конвейеров показывает различия в качестве, оцениваемом по пятибалльной шкале, где 1 соответствует наихудшему, а 5 — наилучшему результату.

Представленная работа демонстрирует, что эффективное выявление «зеленого камуфляжа» требует целостного подхода, учитывающего взаимосвязи между различными утверждениями об устойчивом развитии. EmeraldMind, как система, основанная на графах знаний и механизмах RAG, подчеркивает важность понимания структуры информации для оценки ее достоверности. Это созвучно высказыванию Бертрана Рассела: «Всякое знание есть, в сущности, историческое». Подобно тому, как исторические события взаимосвязаны, так и компоненты графа знаний отражают зависимости между фактами, что позволяет более точно верифицировать заявления и выявлять несоответствия. Рассмотрение каждого утверждения в контексте общей системы знаний, а не изолированно, позволяет избежать поверхностных суждений и добиться более объективной оценки.

Куда Ведет Эта Тропа?

Представленная работа, хотя и демонстрирует улучшение в обнаружении “зеленого камуфляжа”, лишь слегка приоткрывает завесу над истинной сложностью проблемы. Масштабируемость здесь определяется не вычислительной мощностью, а ясностью идей, лежащих в основе построения графа знаний. Попытки “пришить” искусственный интеллект к существующим отчетам ESG неизбежно наталкиваются на проблему неполноты и предвзятости исходных данных — экосистема, в которой каждый элемент влияет на целое, и искажение в одном месте порождает ошибки во всей структуре.

Будущие исследования должны сместить фокус с простой идентификации ложных утверждений на построение динамических, самообучающихся графов знаний, способных учитывать контекст, намерения и даже культурные особенности. Необходимо разработать метрики, позволяющие оценить не только точность, но и качество обоснования, — ведь просто указать на ложь недостаточно, необходимо показать, почему она является ложью. В противном случае, мы рискуем создать очередную “черную коробку”, которая лишь усугубит недоверие к отчетам об устойчивом развитии.

В конечном итоге, успех в этой области зависит не от сложности алгоритмов, а от нашей способности к критическому мышлению и готовности признать, что идеальной системы не существует. Прозрачность, открытость и постоянная проверка — вот те принципы, которые должны лежать в основе любого подхода к оценке экологической ответственности.

Оригинал статьи: https://arxiv.org/pdf/2512.11506.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-12-15 17:06