Ich habe mir diesen Post schon vor sehr sehr langer Zeit vorgenommen. Ich dachte mir damals „Das schaff ich locker bis Folge 100“. Jetzt sind wir schon bei Folge 150 und es ist immer noch nicht up-to-date, weil ich ein faules Schwein bin. Aber worum geht es eigentlich.
Ich bin ein Fan von Verflixxte Klixx. Und ähnlich wie in diesem Post, habe ich versucht alle interessant Informationen aller Folgen zusammenzutragen und statistisch aufzubereiten und auszuwerten. Das hieß stundenlanges skippen durch Videos (j und k sind die besten Freunde) um Tipps, Fischkarten und Multiplikatoren zu erfassen. Ich muss damals Urlaub gehabt haben, anders kann ich mir das nicht erklären…
Ich habe mich nicht so weit in die Statistik vorgewagt wie @Nereos vor mir. Finde es allerdings wahnsinnig interessant und cool welche Arbeit schon gemacht wurde. Deshalb seht das eher als eine Art abgespeckte Weiterführung an.
Diese kleine Webseite ist auf Heroku mit einem Hobby Plan gehostet. Es kann also unter Umstände etwas langsam sein. Ich wollte es einfach mal mit euch teilen, weil ich glaube, dass man mit diesen Daten (noch) sehr viel Spaß haben kann.
Mein Plan ist es in der nächsten Zeit alle Daten in eine CSV Datei einzutragen und die Webseite mit weiteren interessanten Plots und Auswertungen zu erweitern. Ich weiß nicht wie oft ich dazu komme, da die Arbeit und andere Hobbies einfach Zeit in Anspruch nehmen.
Wenn mir jemand helfen möchte die Daten aktuell zu halten, wäre ich höchst erfreut. Ich habe ein Github Repository erstellt und eine Anleitung verfasst, wie man das machen kann. Als Anregung, momentan habe ich die CSV noch nicht erweitert um Undercover-Videos zu tracken .
Würde mich über Feedback und Vorschläge freuen. Gerne hier oder als Github Issue.
Die Grafiken zu den Viewzahlen (und vllt zu den jeweils 30 meisten Tipps) würde ich als Histogram darstellen, sodass man möglichlicherweise interessante Verteilungsmuster erkennen kann (Glockenkurve? Gleichverteilung? etc)
Sehr interessant fänd ich eine Grafik dazu, inwiefern sich die Schätzungen der beiden im Laufe der Zeit verbessert/schlechtert haben. Also auf der X-Achse eine Zeitskale von Anfang erster Staffel bis heute; auf der Y-Achse zB die Abweichung zwischen Tipps und Views. Dabei jeweils eine Linie für Florentin und Lars.
Du scheinst ein paar mal Signifikanztests gemacht zu haben, um Zusammenhänge im Schätzverhalten, oder zwischen Schätzungen und Ergebnissen zu untersuchen. Interessanter fänd ich aber die Unterschiede zwischen Florentin und Lars auf Signifikanz zu untersuchen. Somit würde man „wissenschaftlich“ sehen, ob beide wirklich unterschiedliche Strategien fahren oder ob ihre Unterschiede im Grunde nur Zufall/Glück sind.
Das sind alles gute Ideen. Ich habe bzgl. Histogramm und Abweichungen der Schätzung immer Mal wieder mit der Darstellung getüftelt, da es teilweise sehr große Ausreißer gibt (100mio Views). Es gibt sicherlich eine gute Lösung dafür. Hast du da vielleicht eine bessere Idee?
Signifikanztests habe ich leider keine gemacht. Insofern ist das alles weit entfernt von wissenschaftlich korrekt. Ich würde mich gerne wieder in das Thema reinfuchsen wenn ich Zeit finde.
Sehr geil, vielen Dank.
Florentin ist ja gefühlt, besser geworden in den letzten Monaten.
Kann man dies aus den Statistiken erkennen und passt es eventuell mit der Zeit als mal gesagt wurde sie hätten ihren Randomizer oder so gewechselt?