Ein Algorithmus zur Erzeugung synthetischer seltener Ereignisse aller Art

Eine häufige Anwendung der artificial intelligence besteht darin, Personen oder Ereignissen von Interesse eine Wahrscheinlichkeit oder einen Wert zuzuweisen. Dieses Scoring-Problem gilt für viele Bereiche, z. B. für die Erkennung von Krankheiten, die vorausschauende Wartung in Fabriken, die Kaufneigung von Online-Besuchern oder das Risiko, Abonnenten zu verlieren. In diesen Situationen ist die Zahl der interessanten Ereignisse im Vergleich zur Gesamtzahl der verfügbaren data weitaus größer. Dieses Ungleichgewicht macht das Training von Modellen des maschinellen Lernens besonders komplex, da sie dazu neigen, sich auf die Mehrheit der Fälle zu konzentrieren und seltene Fälle zu ignorieren oder zu unterschätzen, was beim Einsatz von AI zu zahlreichen operativen Problemen führt. Es gibt einige Algorithmen, die jedoch nicht für kategorische data geeignet sind und im Allgemeinen die Genauigkeit des endgültigen Modells nicht verbessern.

Um diese Herausforderung zu meistern, Artefact research center eine neue Rebalancing-Methode für tabellarische data vorgeschlagenvor, die sowohl numerische als auch kategorische Variablen berücksichtigt. Getestet an dataGetestet an Open-Source-Daten, zeigt dieser Ansatz signifikante Verbesserungen in Bezug auf die Leistung, während die Konsistenz, Plausibilität und Interpretierbarkeit der data erhalten bleibt - ein Aspekt, der bei bestehenden Methoden oft übersehen wird. Der Data erfordert die Erstellung von Dummy-Beispielen, bei denen die Gefahr besteht, dass sie unplausibel sind, wie z. B. Kundenprofile, die nicht existieren. Dieses Risiko hat eine direkte Auswirkung auf den Einsatz von artificial intelligence in Fällen, in denen Analysten die vom Modell vorausgewählten wahrscheinlichsten Beispiele manuell validieren müssen. Artefact löst dieses Problem, indem es beim Rebalancing nur plausible data erzeugt, was die Übernahme durch Unternehmen erleichtert.

 

Eine schlüsselfertige Forschungspartnerschaft mit Anwendungen für Societe Generale-Anwendungsfälle

Diese Arbeit ist das Ergebnis einer dreifachen Partnerschaft zwischen dem Artefact Research Center, dem Labor für Wahrscheinlichkeitsrechnung, Statistik und Modellierung der Universität Sorbonne (LPSM) und der Societe Generale. Die Zusammenarbeit ermöglichte es, ein dreijähriges Forschungsthema zu definieren, das ein Gleichgewicht zwischen statistischen und IT-Herausforderungen und den konkreten Problemen von Unternehmensteams schafft, für die es keine modernen Lösungen gibt. Im Fall dieser Anwendung berichteten verschiedene Vertriebsexperten über das Problem der Inkonsistenz der von den bestehenden Ansätzen erstellten Bankprofile, was die Annahme eines AI Tools einschränkte und die Herausforderung mit sich brachte plausible Vorschläge während des Rebalancing-Algorithmus zu erhalten.

Im Rahmen dieser Partnerschaft konnten die Forscher von Artefact und der Universität Sorbonne ihre Ansätze an echten data testen, was die statistische Genauigkeit des vorgeschlagenen Algorithmus bestätigte. Ein einzigartiges Element beim Testen der Leistung der vorgeschlagenen Methode war außerdem die Skalierung auf Millionen von data , die in angemessener Zeit verarbeitet werden konnten und damit die Größe entsprechender Open-Source-Datensätze übertrafen. Der Code ist quelloffen und die Methodik wird in dem wissenschaftlichen Artikel ausführlich erläutert, so dass möglichst viele Menschen den Ansatz für andere Scoring-Anwendungsfälle nutzen können.

Etienne GUIBOUT, Group Chief AI Officer bei der Societe Generale, erklärt:

"Durch diese Zusammenarbeit erhält die Societe Generale Zugang zu ergänzendem Fachwissen aus der akademischen Welt. Sie fördert die Innovation durch die Einbeziehung verschiedener Perspektiven, um Lösungen zu finden, die immer mehr auf unsere Probleme zugeschnitten sind. Die Aufnahme in eine A-Level-Konferenz ist ein Qualitätsmerkmal für die Teams von Societe Generale. Sie zeigt die Anerkennung der Wirkung der geleisteten Arbeit durch Fachkollegen und Branchenexperten. Die Teilnahme an solchen Veranstaltungen ermöglicht es uns, unsere Forschungsergebnisse zu teilen und gleichzeitig Teil des Ökosystems zu bleiben. Die Geschäftsteams der Societe Generale, insbesondere im Bereich Compliance, waren an der Entwicklung dieses Artikels beteiligt. Ihre Branchenkenntnis und ihr Feedback bestätigten die Relevanz und Anwendbarkeit der dargestellten Inhalte. Diese interdisziplinäre Zusammenarbeit gewährleistet, dass der Artikel die Marktrealitäten widerspiegelt und in erster Linie unseren Bedürfnissen und denen unserer Kunden dient."

Emmanuel Malherbe, Direktor des Artefact Research Center:

"Dies ist eine ideale Partnerschaft für unser research center, die unsere Vision von angewandter, nützlicher und gemeinsamer Forschung perfekt illustriert. Maschinelles Lernen ist ein Bereich, der immer mit data und einem echten Problem beginnt. Durch diese Zusammenarbeit konnten wir uns auf das schlecht gelöste Problem der Auswertung von unausgewogenen data konzentrieren, das jedoch ein wiederkehrendes Problem in der Wirtschaft ist und viele statistische Fragen aufwirft. Die Möglichkeit, den Ansatz an realen data zu testen und zu validieren, war ebenfalls entscheidend für die Entwicklung eines schnellen, effizienten und genauen Algorithmus."

Link zur wissenschaftlichen Arbeit und zum Code des Algorithmus:

Das research center von Artefactals Brücke zwischen Wissenschaft und Industrie

Wir sind ein Team von 20 Wissenschaftlern, die in den Bereichen maschinelles Lernen, Informatik und Managementwissenschaften arbeiten. Wir widmen uns der Verbesserung von AI , sei es, indem wir sie besser interpretierbar und kontrollierbar machen, oder indem wir ihren Einsatz in Unternehmen untersuchen. Unsere gesamte Arbeit ist Open Source, mit Präsentationen auf internationalen Konferenzen mit Peer-Review, wissenschaftlichen Veröffentlichungen, Whitepapers und frei verfügbarem Code. Wir arbeiten eng mit renommierten Universitätsprofessoren zusammen. Unsere Philosophie ist es, die Kluft zwischen Industrie und Wissenschaft zu überbrücken. Unsere Forschungsbereiche sind von realen Problemen inspiriert, die in Artefact mit unseren Kunden auftreten, und wir bauen kontinuierlich Industriepartnerschaften auf, um unsere Methoden an realen Anwendungsfällen und Datensätzen zu testen.

 

Ein wichtiges Beispiel ist die Erklärbarkeit von statistischen Modellen. Die Übernahme von Modellen des maschinellen Lernens wird in vielen Anwendungsfällen durch die "Blackbox"-Natur bestimmter Modelle behindert, d. h. durch ihre mangelnde Transparenz und Verständlichkeit. Es müssen daher transparentere Modelle vorgeschlagen werden, wobei die damit verbundene Verschlechterung der Vorhersageleistung minimiert werden muss. Mit den von ihm vorgeschlagenen Lösungen verbessert das research center die Akzeptanz von AI , indem es die von der Industrie gewünschten Garantien bietet.