Ein Empfehlungssystem mit crowd-basierten Beschreibungen latenter Faktoren (Bachelor Informatik/Komedia)

Empfehlungssysteme sind heute allgegenwärtig, sei es bei Filmen auf Netflix, Musik auf Spotify oder Nachrichten auf GoogleNews. Aufgrund der teilweise sehr komplexen und statistischen Arbeitsweise der für die Empfehlungserstellung zuständigen Algorithmen, ist es jedoch oft schwer die Empfehlungen zu erklären. Daher ist es Nutzern selten möglich zu verstehen weshalb bestimmte Artikel empfohlen werden. Matrixfaktorisierung stellt beispielsweise ein sehr weit verbreitetes Verfahren zur automatischen Berechnung von Empfehlungen dar. Auf Grundlage von Nutzerbewertungen für Produkte (z.B. einer 5-Sterne-Skala) werden automatisch latente Faktoren gelernt, mit denen sich zukünftige Bewertungen sehr präzise vorhersagen lassen. Allein durch die Matrixfaktorisierung sind die Faktoren nicht mit semantischen Konzepte verbunden, es wird jedoch angenommen, dass eine solche Beziehung existiert (z.B. könnte eine Faktor den Action-gehalt eines Kinofilms angeben). Um solche Zusammenhänge aufzudecken, wurde in einer vergangenen Abschlussarbeit ein Onlinespiel entwickelt, das Spieler dazu motiviert Gemeinsamkeiten der Produkte für bestimmte Faktoren zu identifizieren [1].

Mithilfe dieses Spiels konnten bereits vielversprechende Begriffe gesammelt werden, die sowohl einheitlich innerhalb der Faktoren, aber auch unterschiedlich zwischen den Faktoren sind. Nun steht jedoch noch der praktische Einsatz dieser Beschreibungen für Empfehlungsssysteme aus, was zentraler Bestandteil dieser Arbeit ist. Verschiedene Ansätze sind dabei denkbar, z.B. eine automatische Erstellung von Erklärungen zu den Empfehlungen basierend auf den relevanten Faktoren. Zusätzlich könnten die Beschreibungen auch eingesetzt werden, um einen neuen Nutzer im Faktorraum zu positionieren, wodurch diesem ad-hoc personalisierte Empfehlungen präsentiert werden können.

Die Arbeit richtet sich an Studierende im Bachelor Komedia oder Angewandte Informatik. Für die Arbeit sind Programmierkenntnisse erforderlich. Zudem sind Kenntnisse in der Durchführung und Auswertung empirischer Studien hilfreich. Interessenten melden sich bitte mit aktuellem Notenspiegel bei Johannes Kunkel.

[1] Kunkel, J., Loepp, B., & Ziegler, J. (2018). Understanding Latent Factors Using a GWAP. In RecSys ’18: Proceedings of the Late-Breaking Results track part of the Twelfth ACM Conference on Recommender Systems.