Die Ludwig-Maximilians-Universität München hat ein innovatives Verfahren entwickelt, das die Erfassung von Treibhausgasemissionen aus Unternehmensnachhaltigkeitsberichten deutlich verbessern könnte. In der Europäischen Union sind große Unternehmen gesetzlich dazu verpflichtet, ihre Emissionen zu dokumentieren. Der herkömmliche Prozess, diese Daten manuell aus umfangreichen PDF-Dokumenten zu extrahieren, erweist sich jedoch als äußerst zeitintensiv und anfällig für Fehler. Daher versuchen viele Organisationen, diesen mühseligen Prozess durch Automatisierung zu optimieren, beispielsweise durch den Einsatz von großen Sprachmodellen (Large Language Models, LLMs). Diese KI-Systeme sind in der Lage, Texte zu analysieren und Antworten zu generieren. Dr. Malte Schierholz, Projektkoordinator am Social Data Science and AI Lab (SODA Lab), warnt jedoch davor, diesen Technologien blind zu vertrauen. „Die Gefahr besteht darin, dass man die Ergebnisse eines LLMs unkritisch akzeptiert und dabei häufige Fehler übersieht“, erklärt er.
Die Automatisierung bietet zwar vielversprechende Ansätze, ist jedoch auch mit Risiken verbunden. Deshalb hat die Forschungsgruppe Greenhouse Gas Insights and Sustainability Tracking (GIST) das Ziel verfolgt, eine zuverlässige Referenz für die Erfassung von Emissionsdaten zu schaffen. In einer kürzlich veröffentlichten Studie im Fachjournal Scientific Data präsentieren die Forscher einen Goldstandard-Vergleichsdatensatz zur Ermittlung von Treibhausgasemissionen. Dieser Datensatz basiert auf Nachhaltigkeitsberichten von Unternehmen aus dem MSCI World Small Cap Index und dem DAX.
Die Herausforderung bestand darin, die Emissionswerte aus den PDF-Dokumenten in eine strukturierte Tabelle zu überführen. „Obwohl dies einfach erscheinen mag, stellte sich heraus, dass der Prozess sehr komplex ist“, berichtet Schierholz. In einem mehrstufigen Verfahren arbeiteten Experten für nachhaltige Finanzen der LMU sowie der Deutschen Bundesbank zusammen, um klare Regeln für die Datenerfassung zu definieren. Durch mehrere Extraktions- und Verifizierungsrunden sowie durch die Einberufung von Experten-Diskussionsgruppen wurde sichergestellt, dass die Daten akkurat und vergleichbar sind. Jacob Beck, der die Datenerfassung leitete, betont: „Um einen präzisen Datensatz zu erhalten, der Vergleiche zwischen Unternehmen ermöglicht, sind klare Regeln und zahlreiche Feedbackschleifen unerlässlich.“
Ein zentrales Ergebnis der Studie war die Erkenntnis, dass viele Unternehmen ihre Emissionen unzureichend dokumentieren. Dr. Andreas Dimmelmeier, Forscher für nachhaltige Finanzen im GreenDIA-Konsortium, hebt hervor, dass die schwer zu lösenden Fälle oft auf komplexe und inkonsistente Berichtsprotokolle sowie auf fehlende Kontextinformationen zurückzuführen sind. „In unserer Untersuchung stellte sich heraus, dass viele Unternehmen ihre Emissionen nicht gemäß den etablierten Berichts- und Berechnungsrahmen offenlegten“, fügt er hinzu. Außerdem fand das Team heraus, dass etwa die Hälfte der untersuchten Berichte keine verwertbaren Daten zu Treibhausgasemissionen enthielt. Wenn Emissionen angegeben wurden, beschränkten sich die meisten auf direkte und indirekte Emissionen aus dem Energieverbrauch, während andere indirekte Emissionen, wie die, die entlang der Lieferketten oder durch Reisen und Transport entstehen, oft unvollständig dokumentiert waren.
Der neu entwickelte Datensatz bietet zusammen mit den zugehörigen Skripten und ergänzenden Materialien eine transparente und sorgfältig aufbereitete Grundlage für die Bewertung automatisierter Ansätze in der Nachhaltigkeitsberichterstattung. Durch die explizite Dokumentation von Annahmen und Entscheidungen wird es möglich, faire Methodenvergleiche anzustellen und die Unsicherheit bezüglich der Angaben besser zu kommunizieren. Die GIST-Gruppe hofft, dass diese fundierte Basis sowohl in der Forschung als auch in der praktischen Anwendung dazu beitragen wird, Fortschritte in der Emissionsberichterstattung zu messen und kritische Datenlücken auf dem Weg zu Netto-Null-Emissionen zu schließen.
Wissenschaftliche Ansprechpartner für weitere Informationen sind Dr. Malte Schierholz vom Social Data Science and AI Lab der LMU München. Der Datensatz und die entsprechenden Publikationen sind ein Schritt in die richtige Richtung, um die Herausforderungen der Nachhaltigkeitsberichterstattung zu meistern und die Transparenz in der Emissionsberichterstattung zu erhöhen.
