Ein Algorithmus zur Erzeugung synthetischer seltener Ereignisse aller Art
Eine gängige Anwendung artificial intelligence Personen oder Ereignissen von Interesse eine Wahrscheinlichkeit oder einen Wert zuzuweisen. Dieses Bewertungsproblem findet in vielen Bereichen Anwendung, beispielsweise bei der Erkennung von Krankheiten, der vorausschauenden Instandhaltung in Fabriken, der Kaufneigung von Online-Besuchern oder dem Risiko, Abonnenten zu verlieren. In diesen Situationen sind die Ereignisse von Interesse zahlenmäßig deutlich unterlegen gegenüber der Gesamtmenge data verfügbaren data. Dieses Ungleichgewicht macht das Training von Modellen des maschinellen Lernens besonders komplex, da diese dazu neigen, sich auf die Mehrheit der Fälle zu konzentrieren und seltene Fälle zu ignorieren oder zu unterschätzen, was bei AI zahlreiche operative Probleme mit sich bringt. Es gibt zwar einige Algorithmen, diese sind jedoch nicht für kategoriale data geeignet und können die Genauigkeit des endgültigen Modells in der Regel nicht verbessern.
Um dieser Herausforderung gerecht zu werden, hat research centerArtefact eine neue Methode zur Neugewichtung tabellarischer data, die sowohl numerische als auch kategoriale Variablen berücksichtigt. Getestet an data, zeigt dieser Ansatz erhebliche Leistungsverbesserungen bei gleichzeitiger Wahrung der Konsistenz, Plausibilität und Interpretierbarkeit der data – ein Aspekt, der bei bestehenden Methoden oft übersehen wird. Data erfordert die Erstellung von Dummy-Beispielen, bei denen die Gefahr besteht, dass sie unplausibel sind, wie beispielsweise nicht existierende Kundenprofile. Dieses Risiko wirkt sich direkt auf die Einführung artificial intelligence aus artificial intelligence Analysten die vom Modell vorab ausgewählten, wahrscheinlichsten Beispiele manuell validieren müssen. Artefact dieses Problem, indem es data Rebalancing ausschließlich plausible data erstellt, was die Einführung in Unternehmen erleichtert.

Eine schlüsselfertige Forschungspartnerschaft mit Anwendungen für Anwendungsfälle der Société Générale
Diese Arbeit ist das Ergebnis einer dreiseitigen Zusammenarbeit zwischen dem Artefact Research Center, dem Labor für Wahrscheinlichkeit, Statistik und Modellierung (LPSM) der Universität Sorbonne und der Société Générale. Die Zusammenarbeit ermöglichte es, ein dreijähriges Forschungsthema zu definieren, das ein Gleichgewicht zwischen statistischen und IT-Herausforderungen sowie den konkreten Problemen schafft, mit denen Geschäftsteams konfrontiert sind und für die es keine Lösungen auf dem neuesten Stand der Technik gibt. Tatsächlich hatten im Falle dieser Anwendung verschiedene Vertriebsexperten das Problem der Inkonsistenz der durch bestehende Ansätze generierten Bankprofile gemeldet, was deren Einsatz eines AI Tools einschränkte und somit die Herausforderung aufwarf, plausible Vorschläge während des Rebalancing-Algorithmus aufrechtzuerhalten.
Im Rahmen dieser Partnerschaft konnten Forscher von Artefact der Sorbonne-Universität ihre Ansätze anhand realer data testen, wodurch die statistische Genauigkeit des vorgeschlagenen Algorithmus bestätigt wurde. Ein einzigartiger Aspekt bei der Überprüfung der Leistungsfähigkeit der vorgeschlagenen Methode war zudem die Skalierung auf Millionen von data , die in einem angemessenen Zeitrahmen verarbeitet werden mussten, womit die Größe vergleichbarer Open-Source-Datensätze übertroffen wurde. Der Code ist Open Source und die Methodik wird in dem wissenschaftlichen Artikel ausführlich erläutert, sodass möglichst viele Menschen den Ansatz für andere Anwendungsfälle im Bereich der Bonitätsbewertung nutzen können.
Etienne GUIBOUT, Group Chief AI bei der Société Générale, erklärt:
„Diese Zusammenarbeit verschafft der Société Générale Zugang zu ergänzendem Fachwissen aus der akademischen Welt. Sie fördert Innovation, indem sie eine Vielzahl von Perspektiven einbezieht, die darauf abzielen, Lösungen zu finden, die zunehmend auf unsere Probleme zugeschnitten sind. Die Zulassung zu einer hochrangigen Konferenz ist ein Qualitätsmerkmal für die Teams der Société Générale. Sie zeugt von der Anerkennung der Bedeutung der Arbeit, die von Kollegen und Branchenexperten geleistet wird. Die Teilnahme an solchen Veranstaltungen ermöglicht es uns, unsere Forschungsergebnisse zu teilen und gleichzeitig Teil des Ökosystems zu bleiben. Die Geschäftsteams der Société Générale, insbesondere die Compliance-Abteilung, waren an der Erstellung dieses Artikels beteiligt. Ihre Branchenexpertise und ihr Feedback bestätigten die Relevanz und Anwendbarkeit der dargestellten Inhalte. Diese interdisziplinäre Zusammenarbeit stellt sicher, dass der Artikel die Realitäten des Marktes widerspiegelt und in erster Linie unseren Bedürfnissen sowie denen unserer Kunden dient.“
Emmanuel Malherbe, Direktor des Artefact Research Center:
„Dies ist eine ideale Partnerschaft für unser research center, die unsere Vision von angewandter, nützlicher und gemeinsamer Forschung perfekt veranschaulicht. Maschinelles Lernen ist ein Bereich, der immer mit data einem realen Problem beginnt. Durch diese Zusammenarbeit konnten wir uns auf das bislang nur unzureichend gelöste Problem der Bewertung unausgewogener tabellarischer data konzentrieren, das dennoch ein immer wiederkehrendes Problem in der Wirtschaft darstellt und viele statistische Fragen aufwirft. Die Möglichkeit, den Ansatz an realen data zu testen und zu validieren, data ebenfalls entscheidend für die Entwicklung eines schnellen, effizienten und präzisen Algorithmus.“
Link zur wissenschaftlichen Veröffentlichung und zum Code des Algorithmus:
- Abdoulaye Sakho, Emmanuel Malherbe, Carl-Erik Gauthier und Erwan Scornet.
„Nutzung gemischter Merkmale für Data mit Ungleichgewicht: Anwendung auf die Bonitätsbewertung von Bankkunden.“ In Gemeinsame Europäische Konferenz über maschinelles Lernen und Wissensgewinnung aus Datenbanken (2025) - https://github.com/artefactory/mgs-grf
research center Artefact research center Brücke zwischen Wissenschaft und Industrie
Wir sind ein Team von 20 Wissenschaftlern, die in den Bereichen maschinelles Lernen, Informatik und Betriebswirtschaftslehre tätig sind. Wir widmen uns der Verbesserung AI , sei es durch die Erhöhung ihrer Interpretierbarkeit und Kontrollierbarkeit oder durch die Untersuchung ihres Einsatzes in Unternehmen. Unsere gesamte Arbeit ist Open Source und umfasst Vorträge auf international anerkannten Fachkonferenzen, wissenschaftliche Publikationen, Whitepaper und frei verfügbaren Code. Wir arbeiten eng mit renommierten Universitätsprofessoren zusammen. Unsere Philosophie ist es, die Kluft zwischen Industrie und Wissenschaft zu überbrücken. Unsere Forschungsbereiche sind von realen Problemen inspiriert, die wir in Artefact mit unseren Kunden begegnen, und wir bauen kontinuierlich Industriepartnerschaften auf, um unsere Methoden an realen Anwendungsfällen und Datensätzen zu testen.

Ein entscheidendes Beispiel betrifft die Erklärbarkeit statistischer Modelle. Die Einführung von Modellen des maschinellen Lernens wird in vielen Anwendungsfällen durch den „Black-Box“-Charakter bestimmter Modelle behindert, oder anders gesagt, durch deren mangelnde Transparenz und Verständlichkeit. Es müssen daher transparentere Modelle entwickelt werden, wobei die damit verbundene Verschlechterung der Vorhersageleistung so gering wie möglich gehalten werden muss. Durch die vorgeschlagenen Lösungen research center das research center die Akzeptanz von AI es die von der Industrie gewünschten Garantien bietet.

BLOG






