Les forums / Statistiques sur demande

Par Mac Arthur Le 09/01/2024 - 15:51 (Modifier)
Mac Arthur

>> Alix avait écrit : >> Alors, j’ai essayé de mettre 2.99 comme « note moyenne » sur le site, voir critère de tri tout en bas de la liste, intitulé « Popularité 2 ». Ca va « régler » les incohérences (je n’aime pas ce mot, mais bon) en milieu de classement, donc une BD à 3/5 avec 3 avis sera plus populaire qu’une BD à 3/5 avec 2 avis. Vous en pensez quoi ? >> >> Mais je continue de penser que l’algo est correct, en haut et en bas de classement. Popularité ne signifie pas nombre d’avis. Vous êtes d’accord pour dire que de manière générale, plus de gens trouvent un film bien, plus on peut dire qu’il est populaire. Et pareillement, plus de gens trouvent un film nul, plus on peut dire qu’il est impopulaire. Les statistiques (bayésiennes) ne font qu’exprimer la chose mathématiquement. Le bas de l’échelle est symétriquement opposé au haut de l’échelle. >> Je pense que mon problème vient de ma perception de ce qui est considéré comme moyen, ainsi que de ma perception de ce qui est considéré comme populaire. Si l'on avait seulement trois séries sur ce site, avec deux notées à 5/5 et une notée à 4/5. celle notée à 4/5 serait en dessous de la moyenne du site. Je ne la considérerais pourtant pas comme "en dessous de la moyenne" mais bien toujours franchement bien, car c'est la note qui lui est attribuée. Idem pour moi pour une série notée comme "pas mal". Si en moyenne, les lecteurs la trouvent pas mal, je ne parviens pas à la considérer comme nulle, même si elle est en dessous de la moyenne générale du site. De même, dans ma perception, si deux séries ont la mêmes moyenne, celle qui a été le plus souvent avisée me parait être la plus populaire, même si sa note est basse. Au moins celle qui a eu beaucoup d'avis a-t-elle suffisamment attiré les lecteurs pour qu'ils se donnent la peine de lire la bd. Avec une note de 2,5/5 pour 40 avis, je me dis intuitivement qu'il y a quand même une vingtaine de lecteurs qui l'on trouvée "pas mal" alors qu'avec un 2,5/5 pour deux avis, je ne peux m'empêcher de penser que seul un lecteur a trouvé la série pas mal. Mais j'ai bien conscience qu'il s'agit d'un ressenti personnel. Donc voilà... Au moins maintenant je comprends la logique derrière la formule mathématique. Sourire


Par Alix Le 09/01/2024 - 15:24 (Modifier)
Alix

Alors, j’ai essayé de mettre 2.99 comme « note moyenne » sur le site, voir critère de tri tout en bas de la liste, intitulé « Popularité 2 ». Ca va « régler » les incohérences (je n’aime pas ce mot, mais bon) en milieu de classement, donc une BD à 3/5 avec 3 avis sera plus populaire qu’une BD à 3/5 avec 2 avis. Vous en pensez quoi ? Mais je continue de penser que l’algo est correct, en haut et en bas de classement. Popularité ne signifie pas nombre d’avis. Vous êtes d’accord pour dire que de manière générale, plus de gens trouvent un film bien, plus on peut dire qu’il est populaire. Et pareillement, plus de gens trouvent un film nul, plus on peut dire qu’il est impopulaire. Les statistiques (bayésiennes) ne font qu’exprimer la chose mathématiquement. Le bas de l’échelle est symétriquement opposé au haut de l’échelle. Donc, si on prend en exemple le thème « Amnesie » de Mac Arthur, trié avec l’algo existant (pas celui en test ci-dessus) : https://www.bdtheque.com/recherche/series/theme=331-amnesie/1/2/pop Au-dessus de la note moyenne : Spawn (3.89/5 pour 9 avis) est considéré plus populaire que La Parenthèse (4.17/5 pour 6 avis), alors que la note est plus basse de 0.28 points. En dessous de la moyenne : Les Princes d'Ambre (2.4/5 pour 5 avis) est considéré plus populaire que Volunteer (2.9/5 pour 30 avis), alors que la note est 0.5 points plus basse. En cherchant bien, on pourra trouver un cas avec exactement la même différence (pas trop le temps de chercher là). C’est une courbe miroir… plus la note est au-dessus de la moyenne ET plus grand le nombre d’avis, plus c’est populaire. Plus la note est en dessous de la moyenne ET plus grand le nombre d’avis, moins c’est populaire, et ceci de manière exactement opposée. De manière générale, je trouve que ça fonctionne parfaitement. Le seul souci avec les stats, c’est les cas avec un faible nombres de données (peu d’avis) et les cas « border line », quand on s’approche des valeurs clé (ici, la moyenne du site).


Par Ro Le 09/01/2024 - 13:48 (Modifier)
Ro

>> Alix avait écrit : >> >> Alors, c'est "logique", si je puis dire. Dans la formule je specifie la note moyenne de tous les avis, qui est actuellement 3.12 >> Donc l'algo voit un avis à 3/5 comme etant en dessous de la moyenne... donc plus d'avis à 3/5 sera vu comme plus de gens trouvant la serie en dessous de la qualité moyenne du site. C'est mathematique. Pour remedier à la chose, il faudrait mettre 2.99 comme valeur dans la formule. Je peux facilement faire des tests, pour voir ce que ca donne... mais bon, c'est tricher, non ? Qu'en pensez vous ? L'exemple montré par Mac Arthur me parait quand même assez manifeste : J'ai du mal à penser qu'une série avec 30 avis et une moyenne à 2,9/5 puisse être moins populaire qu'une série avec 5 avis et 2,4/5 de moyenne. Sachant que les gens mettent 3/5 quand ils veulent dire qu'une série est moyenne, ça me parait mieux que de se baser sur 3.12. Est-ce que passeer à 3/5 corrige l'incohérence du classement de cette image ?


Par Mac Arthur Le 09/01/2024 - 13:12 (Modifier)
Mac Arthur

>> Alix avait écrit : >> >> Mac Arthur avait écrit : >> >> Oups, nos interventions se sont croisées. Regarde la capture d'écran que j'ai faite. Pour bdtheque, Matière fantôme (6 avis - 2,17/5 de moyenne) est moins populaire que Table rase (2 avis - 1/5 de moyenne). C'est sans doute logique pour toi mais moi, j'ai du mal à la comprendre, cette logique (plus d'avis et une note plus élevée = moins populaire ?) >> >> Mathematiquement, c'est logique oui... plus de gens trouvent ca nul. >> C'est la meme chose que vers le haut, mais inversé. >> Donc une serie avec un avis à 1/5 est plus populaire (ou moins non populaire) que une serie avec 5 avis et une note de 1.3/5. Ca reste une note basse, et beaucoup plus de gens trouvent que c'est une mauvaise serie. Ok. Merci pour ta réponse. Ca ne me parait toujours pas logique mais au moins j'ai une explication Sourire


Par Alix Le 09/01/2024 - 13:06 (Modifier)
Alix

>> Mac Arthur avait écrit : >> Oups, nos interventions se sont croisées. Regarde la capture d'écran que j'ai faite. Pour bdtheque, Matière fantôme (6 avis - 2,17/5 de moyenne) est moins populaire que Table rase (2 avis - 1/5 de moyenne). C'est sans doute logique pour toi mais moi, j'ai du mal à la comprendre, cette logique (plus d'avis et une note plus élevée = moins populaire ?) Mathematiquement, c'est logique oui... plus de gens trouvent ca nul. C'est la meme chose que vers le haut, mais inversé. Donc une serie avec un avis à 1/5 est plus populaire (ou moins non populaire) que une serie avec 5 avis et une note de 1.3/5. Ca reste une note basse, et beaucoup plus de gens trouvent que c'est une mauvaise serie.


Par Ro Le 09/01/2024 - 13:06 (Modifier)
Ro

>> Alix avait écrit : >> Alors, c'est "logique", si je puis dire. Dans la formule je specifie la note moyenne de tous les avis, qui est actuellement 3.12 >> Donc l'algo voit un avis à 3/5 comme etant en dessous de la moyenne... donc plus d'avis à 3/5 sera vu comme plus de gens trouvant la serie en dessous de la qualité moyenne du site. C'est mathematique. Pour remedier à la chose, il faudrait mettre 2.99 comme valeur dans la formule. Je peux facilement faire des tests, pour voir ce que ca donne... mais bon, c'est tricher, non ? Qu'en pensez vous ? Il n'y a pas un moyen d'inverser le calcul de la popularité quand la note de la série est en dessous de la moyenne du site ?


Par Mac Arthur Le 09/01/2024 - 12:57 (Modifier)
Mac Arthur

>> Alix avait écrit : >> >> Ryle avait écrit : >> >> >> Mac Arthur avait écrit : >> >> >> Pour les séries dont la moyenne est supérieure à 3/5, je trouve que le classement par popularité fonctionne relativement bien. >> >> >> Par contre, dès qu'on arrive à des moyennes inférieures ou égales à 3/5, le système foire complètement. Une série avec 1 avis à 3/5 sera considérée plus populaire qu'une série avec 125 avis et une moyenne de 3/5 par exemple. >> >> >> >> >> >> ... Mais pour les notes hautes, le système me satisfait (même si j'utilise plus volontiers le classement par note moyenne plutôt que par popularité). >> >> >> >> Je ne sais pas comment elle est calculée sur bdt, mais c'est assez bizarre comme résultat, puisque c'est normalement tout l'intérêt de la moyenne pondérée que de mettre la note en regard de son nombre d'avis et éviter qu'une série avec une seule note de 5/5 ne soit devant une série avec 99 notes de 5/5 et une note de 4/5 (soit une moyenne inférieur à 4,99 alors qu'elle est quand même plébiscité par 98 personne de plus que la première, malgré 1 détracteur Sourire) >> >> >> >> En l'occurrence, si tu recherches et tri par note moyenne, la meilleure série de polar actuelle de BDT c'est A la recherche de Thanh perdue ... selon un panel assez peu représentatif de 1 seule personne à l'avoir lu Clin d >> >> Alors, c'est "logique", si je puis dire. Dans la formule je specifie la note moyenne de tous les avis, qui est actuellement 3.12 >> Donc l'algo voit un avis à 3/5 comme etant en dessous de la moyenne... donc plus d'avis à 3/5 sera vu comme plus de gens trouvant la serie en dessous de la qualité moyenne du site. C'est mathematique. Pour remedier à la chose, il faudrait mettre 2.99 comme valeur dans la formule. Je peux facilement faire des tests, pour voir ce que ca donne... mais bon, c'est tricher, non ? Qu'en pensez vous ? Oups, nos interventions se sont croisées. Regarde la capture d'écran que j'ai faite. Pour bdtheque, Matière fantôme (6 avis - 2,17/5 de moyenne) est moins populaire que Table rase (2 avis - 1/5 de moyenne). C'est sans doute logique pour toi mais moi, j'ai du mal à la comprendre, cette logique (plus d'avis et une note plus élevée = moins populaire ?)


Par Mac Arthur Le 09/01/2024 - 12:53 (Modifier)
Mac Arthur

>> Ryle avait écrit : >> >> Mac Arthur avait écrit : >> >> Pour les séries dont la moyenne est supérieure à 3/5, je trouve que le classement par popularité fonctionne relativement bien. >> >> Par contre, dès qu'on arrive à des moyennes inférieures ou égales à 3/5, le système foire complètement. Une série avec 1 avis à 3/5 sera considérée plus populaire qu'une série avec 125 avis et une moyenne de 3/5 par exemple. >> >> Je ne sais pas comment elle est calculée sur bdt, mais c'est assez bizarre comme résultat, puisque c'est normalement tout l'intérêt de la moyenne pondérée que de mettre la note en regard de son nombre d'avis et éviter qu'une série avec une seule note de 5/5 ne soit devant une série avec 99 notes de 5/5 et une note de 4/5 (soit une moyenne inférieur à 4,99 alors qu'elle est quand même plébiscité par 98 personne de plus que la première, malgré 1 détracteur Sourire) C'est bien pour ça que je dis que la formule de calcul foire complètement Tire la langue Tiens, je te mets un printscreen de la dernière page du thème Amnésie rangé par popularité. Tu m'en diras des nouvelles Sourire

Fichier joint : 513.jpg


Par Alix Le 09/01/2024 - 12:51 (Modifier)
Alix

>> Ryle avait écrit : >> >> Mac Arthur avait écrit : >> >> Pour les séries dont la moyenne est supérieure à 3/5, je trouve que le classement par popularité fonctionne relativement bien. >> >> Par contre, dès qu'on arrive à des moyennes inférieures ou égales à 3/5, le système foire complètement. Une série avec 1 avis à 3/5 sera considérée plus populaire qu'une série avec 125 avis et une moyenne de 3/5 par exemple. >> >> >> >> ... Mais pour les notes hautes, le système me satisfait (même si j'utilise plus volontiers le classement par note moyenne plutôt que par popularité). >> >> Je ne sais pas comment elle est calculée sur bdt, mais c'est assez bizarre comme résultat, puisque c'est normalement tout l'intérêt de la moyenne pondérée que de mettre la note en regard de son nombre d'avis et éviter qu'une série avec une seule note de 5/5 ne soit devant une série avec 99 notes de 5/5 et une note de 4/5 (soit une moyenne inférieur à 4,99 alors qu'elle est quand même plébiscité par 98 personne de plus que la première, malgré 1 détracteur Sourire) >> >> En l'occurrence, si tu recherches et tri par note moyenne, la meilleure série de polar actuelle de BDT c'est A la recherche de Thanh perdue ... selon un panel assez peu représentatif de 1 seule personne à l'avoir lu Clin d Alors, c'est "logique", si je puis dire. Dans la formule je specifie la note moyenne de tous les avis, qui est actuellement 3.12 Donc l'algo voit un avis à 3/5 comme etant en dessous de la moyenne... donc plus d'avis à 3/5 sera vu comme plus de gens trouvant la serie en dessous de la qualité moyenne du site. C'est mathematique. Pour remedier à la chose, il faudrait mettre 2.99 comme valeur dans la formule. Je peux facilement faire des tests, pour voir ce que ca donne... mais bon, c'est tricher, non ? Qu'en pensez vous ?


Par Ryle Le 09/01/2024 - 12:45 (Modifier)
Ryle

>> Mac Arthur avait écrit : >> Pour les séries dont la moyenne est supérieure à 3/5, je trouve que le classement par popularité fonctionne relativement bien. >> Par contre, dès qu'on arrive à des moyennes inférieures ou égales à 3/5, le système foire complètement. Une série avec 1 avis à 3/5 sera considérée plus populaire qu'une série avec 125 avis et une moyenne de 3/5 par exemple. >> >> ... Mais pour les notes hautes, le système me satisfait (même si j'utilise plus volontiers le classement par note moyenne plutôt que par popularité). Je ne sais pas comment elle est calculée sur bdt, mais c'est assez bizarre comme résultat, puisque c'est normalement tout l'intérêt de la moyenne pondérée que de mettre la note en regard de son nombre d'avis et éviter qu'une série avec une seule note de 5/5 ne soit devant une série avec 99 notes de 5/5 et une note de 4/5 (soit une moyenne inférieur à 4,99 alors qu'elle est quand même plébiscité par 98 personne de plus que la première, malgré 1 détracteur Sourire) En l'occurrence, si tu recherches et tri par note moyenne, la meilleure série de polar actuelle de BDT c'est A la recherche de Thanh perdue ... selon un panel assez peu représentatif de 1 seule personne à l'avoir lu Clin d


Par Mac Arthur Le 09/01/2024 - 12:28 (Modifier)
Mac Arthur

>> Alix avait écrit : >> >> gruizzli avait écrit : >> >> Je me pose la question de la pertinence des moyennes pondérées quand je vois que, par exemple, Dans la tête de Sherlock Holmes avec tout ses avis positifs et ses notes n'apparait pas dans le top du thème "Policier-thriller". C'est un des exemples qui m'a étonné récemment >> >> Bon, il y est presque, il manque encore quelques avis, regarde : >>https://www.bdtheque.com/recherche/series/genre=policier-thriller/1/2/pop >> >> Mais bon c'est le concept, plus d'avis = plus de popularité. >> >> Dans la tête de Sherlock Holmes = (4.08/5 pour 25 avis) >> >> Et juste devant dans le classement : >> Il faut flinguer Ramirez = (4.08/5 pour 26 avis) Donc encore 1-2 avis pour passer devant. >> Tyler Cross = (3.97/5 pour 33 avis) >> Batman - Un long Halloween = (4.17/5 pour 23 avis) >> >> Donc c'est logique. >> >> Il faut plus d'avis ! Pour les séries dont la moyenne est supérieure à 3/5, je trouve que le classement par popularité fonctionne relativement bien. Par contre, dès qu'on arrive à des moyennes inférieures ou égales à 3/5, le système foire complètement. Une série avec 1 avis à 3/5 sera considérée plus populaire qu'une série avec 125 avis et une moyenne de 3/5 par exemple. ... Mais pour les notes hautes, le système me satisfait (même si j'utilise plus volontiers le classement par note moyenne plutôt que par popularité).


Par Alix Le 09/01/2024 - 12:12 (Modifier)
Alix

>> gruizzli avait écrit : >> Je me pose la question de la pertinence des moyennes pondérées quand je vois que, par exemple, Dans la tête de Sherlock Holmes avec tout ses avis positifs et ses notes n'apparait pas dans le top du thème "Policier-thriller". C'est un des exemples qui m'a étonné récemment Bon, il y est presque, il manque encore quelques avis, regarde : https://www.bdtheque.com/recherche/series/genre=policier-thriller/1/2/pop Mais bon c'est le concept, plus d'avis = plus de popularité. Dans la tête de Sherlock Holmes = (4.08/5 pour 25 avis) Et juste devant dans le classement : Il faut flinguer Ramirez = (4.08/5 pour 26 avis) Donc encore 1-2 avis pour passer devant. Tyler Cross = (3.97/5 pour 33 avis) Batman - Un long Halloween = (4.17/5 pour 23 avis) Donc c'est logique. Il faut plus d'avis !


Par gruizzli Le 09/01/2024 - 11:59 (Modifier)
gruizzli

>> Ryle avait écrit : >> >> Ro avait écrit : >> >> Quoique... qu'y mettrait-on de nouveau ? >> >> Ryle, tu as des idées ? Clin d >> >> Je pourrais m'estimer comblé avec les moyennes pondérées, mais ça serait mal me connaître... Clin d >> >> Et puis en presque 20 ans d'attente avant qu'elles n'arrivent, j'en ai accumulé des idées... pas sûr qu'Alix ait assez de lundis pour les réaliser par contre, va clairement falloir déborder sur les autres jours de la semaine Tire la langue Je me pose la question de la pertinence des moyennes pondérées quand je vois que, par exemple, Dans la tête de Sherlock Holmes avec tout ses avis positifs et ses notes n'apparait pas dans le top du thème "Policier-thriller". C'est un des exemples qui m'a étonné récemment


Par Ryle Le 09/01/2024 - 11:44 (Modifier)
Ryle

>> Ro avait écrit : >> Quoique... qu'y mettrait-on de nouveau ? >> Ryle, tu as des idées ? Clin d Je pourrais m'estimer comblé avec les moyennes pondérées, mais ça serait mal me connaître... Clin d Et puis en presque 20 ans d'attente avant qu'elles n'arrivent, j'en ai accumulé des idées... pas sûr qu'Alix ait assez de lundis pour les réaliser par contre, va clairement falloir déborder sur les autres jours de la semaine Tire la langue


Par Alix Le 09/01/2024 - 11:01 (Modifier)
Alix

>> Ro avait écrit : >> >> Alix avait écrit : >> >> >> gruizzli avait écrit : >> >> >> Je viens de voir les statistiques du site, et pour la sixième année le site a enregistré plus d'avis que l'année précédente. Pas mal ! >> >> >> >> Oui, depuis la mise en ligne de la v3, fin 2019 ! >> >> Holala ! Vivement la V4 alors ! Gêné >> >> Quoique... qu'y mettrait-on de nouveau ? >> Ryle, tu as des idées ? Clin d Oh ben moi j'en ai plein des idees... mais ni le temps, ni la motivation pour le moment Réfléchit