Statistiken zu Verflixxte Klixx

Ich hab mich mal gefragt, was man über die bisherigen Folgen Verflixxte Klixx statistisch so aussagen kann. Vermutlich hat sich das noch nie jemand anderes gefragt, aber ich dachte ich teile mal meine Erkenntnisse mit euch. (Ja, ich hatte etwas zu viel freie Zeit…)

Ich habe die Daten, die in der Pufopedia stehen verwendet (und die letzten paar Folgen von hand eingetragen). Ich habe alle Folgen, auch die der Staffel 0 vor RBTV-Zeiten, verwendet. Dabei ignoriere ich die zwei Folgen, in denen nicht Lars sondern DeChangeman gespielt hat. Zudem gab es da einmal ein Unentschieden, das für manchen Aspekte auch ignoriert wird. Wer sich die Rohdaten anschauen will, die sind hier in einem Spreadsheet.

Zuerst kommen einfach ein paar Zahlen mit Diagrammen. Dann schaue ich noch, ob Lars eigentlich wirklich (statistisch signifikant) besser spielt als Florentin. Ich hoffe ich habe keine Fehler gemacht, wenn es an die Statistik geht. Wenn jemandem etwas auffällt, gerne drauf hinweisen. Und wenn noch jemand eine Idee hat, was man sich da anschauen könnte, immer her damit.


Siege

  • Lars: 71
  • Florentin: 53

Geierkönige

  • Lars: 53
  • Florentin: 15

Gesamtpunkte

  • Lars: 1560
  • Florentin: 1314

gesamtpunkte

Mittelwert der Punkte bisheriger Folgen

  • Lars: 12.5 ± 10.7
  • Florentin 10.5 ± 8.0

punkte_mittel

Längste Siegessträhne

  • Lars: 6 (schon dreimal)
  • Florentin: 4

siegesstr%C3%A4hne

Höchstes Abstimmung für den Geierkönig

  • Lars: 89% (S2E69)
  • Florentin: 83% (S2E30)

Höchste Punktzahl am Ende einer (regulären) Folge

  • Lars: 87 (S0E3)
  • Florentin: 56 (S2E58) (198 Punkte gegen DeChangeman in S0E12)


Jetzt zu der Frage, ob Lars wirklich signifikant besser ist als Florentin.

Als erstes schauen wir uns die Anzahl der Siege an. Wen nicht interessiert, was ich da mache, und nur das Ergebnis wissen will, kann bis zum tl;dr vorspringen.

Also wir stellen die Nullhypothese auf, dass Lars und Florentin eigentlich gleich gut sind. Das würde bedeuten, dass jede Folge einer von beiden mit 50% Wahrscheinlichkeit gewinnt. Es handelt sich also um einen Bernoulli-Prozess, der einer Binomialverteilung folgt. Wir legen user Signifikanzniveau auf 5% fest (das sagt im wesentlichen, wie hoch das Risiko ist ein false positive zu erhalten).

Jetzt fragen wir uns, wie wahrscheinlich ist es, dass Florentin unter der Annahme der Nullhypothese so schlecht (oder schlechter) abschneidet. Also die Wahrscheinlichkeit, dass er höchstens 53 Folgen gewinnt. Liegt dieser Wert (der p-Wert) unter unserem Signifikanzniveau, ist es sehr unwahrscheinlich, dass unsere Nullhypothese Stimmt. Florentin wäre also wirklich schlechter. Andersherum ist es durchaus wahrscheinlich, dass es nur Pech ist.

Zum aktuellen Zeitpunkt ist der p-Wert 0.063 oder 6.3%. Liegt also über dem Signifikanzniveau von 5%.

tl;dr: Lars gewinnt nicht signifikant mehr Folgen als Florentin!

hypothese_siege

Als zweites könne wir uns noch fragen, ob Lars signifikant mehr Punkte in jeder Folge macht als Florentin.

Ich habe hier den Zweistichproben-t-Test verwendet. Ich gehe hierbei davon aus, dass die Anzahl der Folgen groß genug ist, dass der zentrale Grenzwertsatz anwendbar ist. Die Nullhypothese lautet, dass Lars im Mittel nicht mehr Punkte also Florentin pro Folge macht (rechtsseitiger Test).

Den ganzen t-Test erkläre ich jetzt hier nicht, kann man recht schön auf Wikipedia nachlesen. Die Idee ist, zu überprüfen, ob zwei Stichproben aus zwei Grundgesamtheiten mit gleichem Mittelwert gezogen wurden. Ich verwendet hierbei die Variante bei der davon ausgegangen wird, dass beide Grundgesamtheiten die gleiche Standardabweichung haben. Ich bin mir nicht sicher, in wie weit die Annahme gerechtfertigt ist. Man könnte sich also auch noch den Welch-Test (verschiedene Standardabweichungen) anschauen.

tl;dr: Das Ergebnis ist, dass Lars nicht signifikant mehr Punkte holt als Florentin.

hypothese_punkte

Also wir sehen, dass Florentin offenbar einfach etwas Pech hat, auch wenn es teilweise sehr knapp an der Grenze zur statistischen Signifikanz ist. Zumindest diesen simplen Tests nach zu urteilen.


Was haltet ihr davon (abgesehen davon, dass das ganz schöne Zeitverschwendung war), glaubt ihr der Statistik oder ist Lars doch einfach der unangefochtene Fischmeister?

Und hat noch jemand eine Idee was mach sich da mal anschauen könnte?

61 „Gefällt mir“

Eine tolle Zusammenstellung hast du da gebastelt! :slight_smile: :+1: Bei den echten Statistik-Themen bin ich leider raus, allein aus den Diagrammen kann man aber viele tolle Sachen herauslesen. Vielen Dank für deine Arbeit! :slight_smile:

2 „Gefällt mir“

Danke. Freut mich, dass ich das dann anscheinend nicht nur für mich gemacht hab :blush:

Wow, es wurde ja häufiger schon darüber gesprochen solche Statistiken zu erheben und erstellen, aber du hast es nun endlich auch gemacht! Ich pinge mal @RBTV_Lars und @Pommes_Ruppel hier an, vielleicht kann man es mal in einem MoinMoin ansprechen.

6 „Gefällt mir“

T-Test, Nullphypothese.
Da werden ganz schlimme Erinnerungen an Statistik-Vorlesungen geweckt.

2 „Gefällt mir“

Mich würde noch interessieren, wer unabhängig von der Punktzahl mehr Videos richtig geschätzt hat, also Multiplikatoren und Co. rausgerechnet. Leider steht dazu nichts auf der Pufopedia :slightly_frowning_face:

4 „Gefällt mir“

Wie kann es den sein das das pufopedia aktueller als das Bohnrnwiki ist?

Das stimmt, das wäre noch interessant zu wissen. Mich würde auch noch interessieren ob es den Fischkartenfluch wirklich gibt (also wie oft liegt man mit Fischkarte richtig). Zu beidem gibt es aber leider keine Daten, und mann müsste erstmal alle Folgen durcharbeiten…

3 „Gefällt mir“

Ich entschuldige mich :smiley:

1 „Gefällt mir“

Alter, wie ich solchen Stats P0rn liebe. :beangasm:

3 „Gefällt mir“

Wenn du möchtest, kann ich das mal sichten und dir die Daten zuschicken. Ich liebe solche Stats und ich hab aktuell die Zeit, um zu helfen. Sowohl was den Fischkartenfluch angeht als auch die richtig geschätzten Videos.

6 „Gefällt mir“

Ich habe die kompletten Daten von 59 Folgen, also von knapp über der Hälfte aller Folgen (nur RBTV und dabei die erste Staffel komplett und bei der zweiten Staffel 1-4, 31, 42-77 und 93-95).
Alles folgende bezieht sich daher nur auf diese Folgen.

Bei 786 Videos hat Florentin 365 Mal (46,4%) richtig geschätzt, Lars 425 Mal (54,1%).
Vier Mal haben beide gleich gut geschätzt, deswegen ist die Summe nicht genau 786.

In den 59 Folgen hat jeder Spieler auch 59 Mal die Fischkarte gezogen. Dabei hat Florentin 32 Videos gewonnen, 27 verloren und Lars 33 Videos gewonnen, 26 Videos verloren.

Der Fischkartenfluch existiert also anscheinend nur in unseren Herzen, aber nicht in der Realität.

6 „Gefällt mir“

Nice, hast du das auch für die einzelnen Folgen aufgeschlüsselt? Wenn ja, dürftest du das gerne mit in das Dokument einfügen.

Könntest du sehr gerne machen. Du kannst mir einfach deine E-Mail-Adresse per PN schreiben, dann kann ich dir für das Dokument Rechte zum editieren geben. Könntest das also gleich da mit eintragen wenn du möchtest.

2 „Gefällt mir“

Die kompletten Daten sind hier: https://docs.google.com/spreadsheets/d/18pflOgcWz6aJYER4fFtL3zRPtnDJz-0hl9dFUePja-M/edit#gid=3121581

Im Tabellenblatt “Erklärungen” sind die Beschreibungen der Spalten.

2 „Gefällt mir“

tl;dr: Geiern zahlt sich aus :gunnar:

2 „Gefällt mir“

Das ist ja sehr detailliert. Würde eventuell davon Daten übernehmen, wenn mit etwas einfällt, das man damit machen könnte. Werde gegebenenfalls natürlich dann auf dich verweisen!

Du bist ein geiler Statistik-Hengst! Ich werde so hart trainieren, dass ich irgendwann auch signifikant besser als Florentin bin. Die Statistik muss einfach von der Realität eingeholt werden.

19 „Gefällt mir“

Vor langer Zeit hat mal jemand versucht, eine statistische Berechnung des Geierns aufzustellen. Vielleicht fällt dir dazu ja noch eine gute Möglichkeit ein. Damit ein für allemal bewiesen wird, dass meine Führung in der Geierstatistik eine reine Farce ist (sollte ein anderes Ergebnis herauskommen, bitte Statistik verwerfen).

9 „Gefällt mir“

Das ist ja nur geil. Und Statistik, Schmaschmistik: Immer Team Florentin :heavy_heart_exclamation:

11 „Gefällt mir“