OptoPred

Bei OptoPred (Auslastungsoptimierung für KMU und Selbstständige durch Predictive Matching) handelt es sich um ein gemeinsames Forschungsprojekt mit der Universität Kassel, das aus Mitteln des Landes Hessen im Rahmen des Förderprogramms Distr@l unterstützt wird.

Projektbeschreibung

Die Lyncronize GmbH betreibt mit https://www.lyncronize.com einen KI-basierten Projektagenten für Selbstständige und kleine Unternehmen im DACH-Raum. Lyncronize such im Internet nach geeigneten Projekten für Mitarbeiter, analysiert deren Skills und gibt Empfehlungen zur persönlichen fachlichen Weiterentwicklung.

Gerade die durch das Corona-Virus ausgelöste Volatilität am Projektmarkt stellt eine große Herausforderung für mittelständische Unternehmen dar: So müssen viele Unternehmen zeitgleich neue Projekte für zahlreiche Mitarbeiter finden. Die lange Dauer von Sichtungs-, Bewerbungs- und Auswahlprozessen führt hier zu existenzbedrohenden Liquiditätsengpässen, obwohl nach wie vor zahlreiche Projekte ausgeschrieben sind. Wirtschaftliche Potenziale bleiben so ungenutzt. Daher ist es gerade jetzt besonders wichtig, Angebots- und Nachfrageseite nahtlos durch effizientes und transparentes Matchmaking zusammenzubringen. Bisherige Lösungen auf dem Markt können dies aus drei Gründen nicht leisten:

1. Auftraggeber sind häufig unsicher hinsichtlich der Glaubwürdigkeit der angegebenen Expertise eines Auftragnehmers, und zögern mit der Vergabe von Aufträgen.

2. Sie berücksichtigen nur wenige Faktoren, die für ein passendes und relevantes Matching notwendig sind. So handelt es sich meistens um reines Keyword-Matching, bei dem qualitative Faktoren (z.B. die Dauer von Erfahrungen) und weiche Daten nicht berücksichtigt werden.

3. Bestehende Plattformen sind geschlossene Systeme, die nur eigene Projekte anbieten und als klassische Marktplätze fungieren, während Lyncronize als Agent all diese Plattformen beständig auf passende Projekte analysiert und dadurch die Anmeldung auf Dutzenden unterschiedlichenr Plattformen überflüssig macht.

Projektziele

Das Vorhaben OptoPred zielt darauf ab, diese Projekte schneller zu besetzen, und kleinen Unternehmen und Selbstständigen damit zu helfen, ihre Auslastung hochzuhalten. Dazu entwickeln die Antragsteller ein KI-basiertes Vorhersagemodell, welches gezielt Erfolgswahrscheinlichkeiten von Projektbesetzungen prognostiziert. Das Modell berücksichtigt dabei vorwiegend folgende Dimensionen:

• Qualitätsindikatoren von Profilen, insb.

• glaubwürdige Belege für Skills und Kompetenzen

• Qualitative Hinweise in den Ausschreibungen

Selbständige und KMUs erhalten Unterstützung durch dieses Modell, um so ihre Profilgestaltung und Kompetenzentwicklung informiert zu steuern, und ihre Erfolgsaussichten in der Akquise zu verbessern. Durch die Integration des Vorhersagemodells in den Matching-Algorithmus von Lyncronize wird erwartet, eine deutlich höhere Matchingqualität zu erreichen und eine schnellere Vermittlung von Projekten zu ermöglichen. Den Antragstellern ist in Wissenschaft und Praxis kein Ansatz bekannt, der ein transparentes qualitatives Matching im beschriebenen Umfang leisten könnte.

Partner im Forschungsvorhaben ist Fachgebiet Wirtschaftsinformatik der Universität Kassel von Prof. Dr. Jan Marco Leimeister Das Fachgebiet forscht gestaltungsorientiert und mit hohem Praxisfokus an den Themen Innovation Management, Crowdsourcing, Hybrid Intelligence und Collaboration Engineering. Prof. Leimeister belegt im Forschungsranking der ETH Zürich den vierten Platz unter den forschungsstärksten BWL-Lehrstühlen im deutschsprachigen Raum.

Update 30.06.2021

Im vergangenen halben Jahr lag unser Fokus darauf, unterschiedliche für das Projekt-Matching geeignete Modelle auszuwählen, zu trainieren und prototypisch zu integrieren. Insbesondere möchten wir dabei Effektivität und Flexibilität von Deep Learning- und Shallow Learning-Verfahren gegeneinander testen. Dabei greift unser Matching nicht nur auf ein Modell zurück, sondern auf mehrere, deren Ergebnisse in einem Score zusammengerechnet werden.

Als Beispiel sei ein neuartiges Skill-Clustering genannt: Dabei werden Übereinstimmungen zwischen Skills in einem Profil und einem Projekt nicht einzeln gewichtet, sondern unter Rückbezug auf ihre Zugehörigkeit zu einem Cluster. Ganz typisch könnte es sich bei einem solchen Cluster um einen Tech-Stack handeln, ganz klassisch bspw. die Kombination PHP, MySQL, JavaScript, HTML und CSS. Ist eine Ausschreibung einem solchen Stack zuzuordnen, erfahren die darin befindlichen oder sehr ähnliche Skills eine höhere Bedeutung, da diese i.d.R. implizit vorausgesetzt werden, wohingegen weitere angegebene Skills ggf. eher optional sind.

Zur Ausarbeitung der wissenschaftlichen Ergebnisse des Vorhabens befinden sich derzeit zwei Publikationen in Entwicklung.

Update 31.10.2021

Derzeit testen wir einen Shallow Learning Classifier sowie einen Deep Learning Ansatz auf Grundlage verschiedener Daten des Lyncornize Systems, welche automatisch gelabelt werden. Dabei wird insbesondere ide Interaktion mit Projektvorschlägen (angeschaut, favorisiert, beworben) zur Klassifikation berücksichtigt. Derzeit befinden wir uns im Prozess des Trainings eines Random Forest Classifiers. Erste Auswertungen deuten auf eine gute Performanz des gewählten Shallow Learning Verfahrens hin.
Für die Umsetzung des Deep Learning Classifiers wurde ein Graph Neural Network als möglicher Modelltyp gewählt, welcher die innere Struktur des bisherigen Datenmodells gut einfängt.

Update 30.06.2022

Die Daten sind bereinigt, die Modelle trainiert und das Evaluationsframework steht: die finale Phase von OptoPred ist angelaufen. Um zu erlernen, was richtig gute Matches sind, haben wir Klicks und Matches analysiert und damit zwei verschiedene Verfahren trainiert, die nun gegeneinander angetreten sind. Wie bereits beschrieben, habe wir uns mit dem Random Forest Classifier für einen in vielen Bereichen bewährten Modelltyp entschieden. Unser Deep Learning Modell ist ein Convolutional Neural Network. Beide Modelle sagen vorher, wie wahrscheinlich es ist, dass eine Nutzer:in ein vorgeschlagenes Projekt näher betrachtet und sich bewirbt.

Das Ergebnis des Vergleichs: Der Random Forest (Accuracy von 74,84%) ist (noch) besser als das Deep Learning Modell (72,16%). Deswegen konzentrieren wir uns im weiteren Verlauf auf den Random Forest. Nachdem wir den Score noch weiter optimieren konnten (erneute Testläufe ergeben über 82%), werden wir das Modell in unseren Matching-Algorithmus integrieren, um so zu testen, wie wir die Matching-Resultate auf Lyncronize noch relevanter machen können. Trotzdem wollen wir das das CNN nicht komplett verwerfen. Deep Learning ist datenhungrig und unser Datenbasis wächst stetig. Deswegen planen wir einen neuen Vergleich der beiden Ansätze, wenn die verfügbare Menge an Trainingsdaten beträchtlich gewachsen ist.