nach jahrelangem stillen Konsum habe ich beschlossen auch mal etwas produktives in die Community einzubringen.
Da sich die Rocketbeans in letzter Zeit vermehrt mit dem Thema Hass im Netz auseinandersetzen und auch immer wieder Probleme in der eigenen Community haben wollte ich wissen, wie es um die Community wirklich steht. Ich studiere Data Science und habe anhand von YouTube Kommentaren versucht herauszufinden wie “toxisch” die RBTV YouTube Community ist. Dazu habe ich folgende Methoden angewendet:
Statistische Analyse (EDA)
Natural Language Processing
Sentiment Analysis
Topic Modeling
Toxic Comment Classification (Interaktiv)
Ich gebe dabei immer eine kurze Beschreibung für die oben gennanten Techniken, habe mich aber Grundsätzlich vorallem auf die Resultate und Auswertungen konzentriert.
Es gibt auch ein entsprechendes Github Repository für alle interessierten (Die Website mit den Resultaten ist dabei nicht inkludiert). Github Repo
Ich hoffe, dass es für einige von euch interessant ist und freue mich natürlich über Feedback und Verbesserungsvorschläge. Außerdem möchte ich mich bei allen RBTV Mitarbeitern für die tolle Arbeit bedanken.
Sehr interessant. Tolle Arbeit.
Habs jetzt erst mal nur überflogen, aber in Summe scheint die ach so schlimme RBTV-Community bei weitem nicht so toxisch zu sein, wie mitunter immer noch behauptet wird.
Und Ede polarisiert, hat aber auch echt viel Zuspruch.
Das Fazit wirft da gleich einen kleinen Stock zwischen die Beine deiner Aussage:
Leider gibt es einige Punkte welche die Aussagekraft dieser Analyse beeinträchtigen. Der Zugriff auf gelöschte und versteckte Kommentare ist nur für den Besitzer des Videos erlaubt. Außerdem sorgen viele wunderbare Chatmoderatoren dafür, dass viele Kommentare gar nicht erst sichtbar werden
Da die Kommentare stark moderiert werden, kann man davon ausgehen, dass viele negative Kommentare garnicht das Licht der YouTube Welt erblicken.
Habe mich schon öfter gefragt ob und vor allem wie (technisch gesehen) man die Äußerungen unter den Videos stimmungsmäßig darstellen kann.
Das ist dir hier sehr gut gelungen.
Einige Fragen dazu.
Kannst du sagen wie die zeitlich Entwicklung der Stimmung/“Toxicität” aussieht. Wie haben sich die positiven/negativen Kommentaranteile über der Zeit verändert?
Du erwähnst ja dass Yotube nur bestimmte Kommentare “herunterladen” lässt. Soweit ich sehe sind ca. 22000 Kommentare nicht enthalten . Hast du einen Überblick ob es sich dabei um besondere Kommentare handelt? Möglicherweise vor allem negative, da gemeldete Kommentare ode so?
Dann wäre es schon etwas anderes bei der Gewichtung.
Naja…jetzt ist die Frage, wie viel dieser gelöschten Kommentare wirklich zur “Kern-Community” gehören und wie viel davon von “random Internet Trotteln” kommt oder schlichtweg SPAM ist.
Aber stimmt schon: Das macht meine Aussage natürlich angreifbar, keine Frage.
Einerseits schlecht für die Studie, da es natürlich interessant wäre diese Kommentare zu haben, andererseits muss man auch die Moderatoren loben die eine tolle Arbeit leisten.
Absolut und ich will deine Arbeit damit auch nicht im geringsten schmälern. Wirklich gute Sache und sehr interessant zu lesen. Ich bin ja Fan von User 5
Das wäre in der Tat spannend. Vielleicht auch in bezug zu Abozahlen oder ähnlichem.
Wie kommst du auf die Zahl der 22000 Kommentare? Aber ja, bei den erwähnten Kommentaren handelt es sich um gemeldete bzw gelöschte Kommentare die unter anderem Spam, Hate Speech oder ähnliches enthalten.
Da das derzeit (Mite Januar) die Anzahl der Kommentare unter den Videos ist. (also nicht gelöscht sind) Wenn man aber auf YT zugreift, werden nur ein Teil davon zugänglich gemacht. Habe mich gefragt warum diese Kommentare nicht über die API zugänglich sind. Ob die irgendwie auffällig war oder so
Sehr Interessant, es stimmt natürlich dass die nicht zur Verfügung stehenden Kommentare wahrscheinlich negativ sind aber da sie ja gelöscht werden haben sie ja auch keinen Einfluss auf die öffentliche Wahrnehmung.
Bei durchschnittlicher Kommentarlänge ist dir glaube ich ein Fehler unterlaufen da der Gesamtdurchschnitt ja nicht höher sein kann als die einzelnen Kategorien.
Ob neuere Videos mehr negative Kommentare haben wäre noch Interessant oder ob bei neueren Videos mehr gelöscht werden muss.
Alles in allem aber sehr gute Arbeit
Hi, da hast du recht. Die Werte können nicht stimmen. Sieht aus als ob da die Zeile verutscht ist, werde das checken.
EDIT: Ich hab das jetzt überprüft und ich hab mir da wirklich einen groben Fehler geleistet. Ich habe vergessen einen Wert zu ändern und habe immer durch die Anzahl der gesamten Kommentare geteilt. Die Werte sehen nun sehr anders aus. Danke nochmal.
Also die VoD-Moderation gibt es ungefähr seit Mitte 2018. Da könnte man vielleicht davor und danach einen Unterschied feststellen. Wobei negativ muss nicht heißen, dass es auch von den VoD-Mods gelöscht wird. Die Moin Moins mit den meisten negativen Kommentaren sind in der Zeit mit VoD-Moderation (und besonders start geklickt).