Tell Me Who You Are and I Tell You What You Like: Zusammenhang von Nutzereigenschaften und latenten Faktoren in Empfehlungssystemen (Bachelor Komedia)

Empfehlungssysteme sind ein heute alltägliches Werkzeug, welches Nutzer im Internet unterstützt, aus der immensen Vielfalt von Produkten jene zu finden, die bestmöglich zu den eigenen Präferenzen passen. Matrixfaktorisierung stellt dabei ein besonders populäres Verfahren zur automatischen Berechnung solcher Empfehlungen dar. Auf Grundlage von Nutzerbewertungen für Produkte (z.B. erfasst auf einer 5-Sterne-Skala) werden automatisch latente Faktoren gelernt, mit denen sich zukünftige Bewertungen sehr präzise vorhersagen lassen. Es wird angenommen, dass diese latenten Faktoren in Beziehung zu realweltlichen Konzepten stehen – beispielsweise dem Actiongehalt eines Kinofilms oder dem Grad, zu dem ein Nutzer sich an schwarzem Humor in Filmen erfreut. Allein durch die Matrixfaktorisierung sind solche Bedeutungen der latenten Faktoren jedoch nicht ersichtlich, weshalb es weiterer Verfahren bedarf, um die zugrundeliegenden Konzepte aufzudecken. Unter anderem wurde daher in einer vergangenen Abschlussarbeit ein Onlinespiel entwickelt, das Spieler dazu motiviert, Gemeinsamkeiten der Produkte für bestimmte Faktoren zu identifizieren [1]. Insgesamt hat sich die Forschungsarbeit bislang jedoch vorrangig auf die versteckte Semantik bezüglich der Produkte bezogen, wohingegen Zusammenhänge zwischen Eigenschaften der Nutzer und den latenten Faktoren bisher nicht eingehender untersucht wurden.

In dieser Arbeit soll diese Thematik entsprechend adressiert werden: Es gilt eine Studie zu konzipieren, welche die unterschiedlichen Eigenschaften der Probanden aufnimmt, von demografischen Daten bis zu individuellen Persönlichkeitsmerkmalen. Außerdem sollen Produktpräferenzen erfasst werden, mit deren Hilfe ein vom Lehrstuhl bereitgestelltes Empfehlungssystem anschließend latente Faktoren für die Probanden erlernen kann (dieser Schritt ist nicht Teil der Arbeit). Auf diese Weise soll überprüft werden, ob und in welcher Form die aufgenommenen Nutzereigenschaften in Zusammenhang mit den latenten Faktoren stehen. Neben Konzeption und Durchführung der Studie mit einer angemessenen Teilnehmerzahl ist vor allem auch die Auswertung und Aufbereitung der Ergebnisse Teil der Arbeit.

Für die Arbeit sind Kenntnisse in der Durchführung und Auswertung empirischer Studien notwendig. Darüber hinaus sind Programmierkenntnisse hilfreich. Sollten Sie Interesse an dieser Arbeit haben, nehmen Sie bitte Kontakt mit Johannes Kunkel auf (unter Beifügung eines aktuellen Notenspiegels).

[1] Kunkel, J., Loepp, B., & Ziegler, J. (2018). Understanding Latent Factors Using a GWAP. In RecSys ’18: Proceedings of the Late-Breaking Results track part of the Twelfth ACM Conference on Recommender Systems.

Supervisor

Johannes Kunkel

Former team member

Resources

Related focus areas