Sujet sur Discussion Projet:Les sans pagEs/Flow

Mesurer la diversité de genre des liens cités dans les articles

31
PAC2 (discutercontributions)

Augmenter la diversité de genre dans Wikipédia est l'un des grands défis du mouvement Wikimédia pour les prochaines années (voir notamment Katherine Maher, "Capstone: Making History, Building the Future Together" in *Wikipedia @20*, https://wikipedia20.pubpub.org/pub/4d61w771/release/2)

Il existe de nombreuses initiatives en ce sens comme ce projet sans pagEs ou le Wikidata Human Gender Indicator. Ce dernier s'appuit notamment sur le nombre d'articles biographiques consacrés à des hommes et des femmes.

En complément, on pourrait aussi prendre un article et regarder la diversité de genre des liens cités dans l'article. En travaillant sur l'article Économie (discipline), j'ai commencé à me rendre compte qu'il y avait relativement peu de femmes citées et qu'il fallait peut être y prêter un peu plus d'attention.

J'ai développé un petit script qui récupère la liste des 500 premiers liens cités dans l'article et va chercher pour chacun de ces liens le genre (propriété P21) tel qu'il est renseigné sur Wikidata.

Les résultats bruts sont assez instructifs.

Par exemple, au 20 janvier :

  • l'article "Science politique" compte 28 liens renvoyant vers des hommes contre 1 lien renvoyant vers 1 femme !
  • l'article "Sociologie" compte 74 liens vers des hommes et 0 liens vers des femmes !
  • l'article "Microéconomie" compte 42 liens vers des hommes et 1 liens vers une femme !

Evidemment cette approche pose de nombreuses questions. En particulier, on se sait pas du tout quelle est la "juste proportion" de femmes qui pourraient être citées dans un article. Il n'est pas forcément problématique qu'un article sur l'équipe de France masculine de handball renvoie principalement vers des hommes et pour les articles consacrés à des sujets plus neutres comme les disciplines académiques, il est difficile de se faire une idée sur la proportion raisonnable de liens renvoyant vers des femmes.

En revanche, cette approche peut permettre de se rendre compte, de rendre visible des situations aberrantes. On pourrait par exemple imaginer de faire attention à ce que les articles labellisés respectent une certaine diversité de genre dans les liens cités. On pourrait aussi imaginer de laisser des alertes dans les pages de discussion pour les articles exclusivement "masculins" ou au contraire de valoriser, labelliser les articles qui respectent une certaines diversité de genre.

Je ne sais pas quelle est la bonne idée mais je lance la discussion.

Pa2chant.bis (discutercontributions)

J'en rêvais, tu l'as fait ! Cela s'inscrit dans un constat plus large (absence ou part congrue de la situation des femmes dans des articles d'histoire, ou sur des pays ; inventrices non citées dans les pages sur leur découverte alors que nombre d'hommes sont cités ; sources très masculines dans des domaines où les femmes sont pourtant fortement représentées, par exemple en biologie). Peser sur les labels serait à mon avis une mauvaise idée, car c'est quelquefois représentatif de l'état du monde, et ce serait ajouter une crispation bien inutile. Par contre, avoir l'information est très utile. Dans un premier temps, j'imagine plutôt des listes de travail. Est-ce qu'une catégorie de maintenance (donc non visible dans l'article) pourrait être une solution ? Quels outils sont nécessaires pour lancer ta requête sur une catégorie d'articles ?

PAC2 (discutercontributions)

Merci pour ton retour. C'est pas encore un outil. Pour le moment, c'est un simple script R qui tourne sur ma machine et c'est assez lent. Faut voir si j'arrive à bidouiller un truc javascript pour en faire un outil en ligne.

DeuxPlusQuatre (discutercontributions)

Avoir cette information me parait très intéressante. Cette information demandera sans doute une analyse fine de l'article mais pourrait bien révéler des surprises. À suivre.

Lewisiscrazy (discutercontributions)
PAC2 (discutercontributions)

Merci pour ce retour. Je ne connaissais pas ce modèle mais effectivement ce serait assez complémentaire. PAC2 (discuter) 23 janvier 2021 à 19:38 (CET)

PAC2 (discutercontributions)

Je commence par avancer doucement en laissant un message en page de discussion et en rééquilibrant les articles un à un (voir ici). On peut peut être lancer un hashtag #citonslesfemmes en résumé de contribution.

PAC2 (discutercontributions)

Je poursuis les investigations.

Plus j'avance, plus je me rends compte de la quasi absence des femmes dans des articles généralistes.

PAC2 (discutercontributions)

Pour info, l'outillage avance.

Grâce au bulletin hebdo de Wikidata, j'ai découvert qu'on pouvait habilement combiner des requêtes à l'api et une requête SPARQL (Compteur de liens genrés).

À partir de là, j'ai pu inclure un lien direct vers la requête dans le script Utilisateur:PAC2/Chouette pour l'interface web mobile et développer {{Indice de diversité de genre}} qui permet de créer le lien vers la bonne requête.

PAC2 (discutercontributions)
PAC2 (discutercontributions)

Je développe ma méthode d'investigation et mon outillage sur la question. Ce matin, j'ai regardé les "professions". J'ai pris les 100 professions avec le plus de liens de site sur Wikidata (sorte d'indice de notoriété interne à Wikidata) avec un article en français, je calcule la "diversité de genre" pour ces professions et je regarde les résultats.

J'obtiens un classement des articles en fonction de la par de femmes dans les articles.

Tous les calculs et les résultats sont présentés dans un notebook.

Les résultats sont surprenants :

En bas de l'échelle, on trouve les articles Poète, Architecte, Économiste, Intellectuel, Journaliste, Artiste peintre, etc.

Je retiens de cette petite expérience que l'idée d'avoir une section consacrée à la place des femmes dans un article sur une profession est une bonne idée que l'on pourrait ajouter dans le Wikipédia:Guide au sujet des biais de genre et de sexe.

Tous les retours sur les bienvenus. PAC2 (discuter) 18 juillet 2021 à 10:32 (CEST)

Pa2chant.bis (discutercontributions)

D'où l'intérêt de ne pas faire des articles séparés.

PAC2 (discutercontributions)

Je reprends mes analyses sur la diversité de genre dans les articles avec cette fois un focus sur les disciplines académiques : https://observablehq.com/@pac02/gender-diversity-in-academic-disciplines-in-fr-wikipedia-o.

Évidemment beaucoup de disciplines ont été historiquement dominées par des hommes mais on s'attend quand même à une certaine diversité de genre dans les articles consacrés à des disciplines académiques.

Je fais évoluer l'outillage aussi. J'utilise toujours l'outil Wikipédia:PAWS pour la récupération des données mais j'utilise un notebook Observable pour visualiser les résultats. Mon idée c'est que c'est pertinent de faire des analyses à un moment donné plutôt que d'avoir un outil qui calculé les résultats en temps réel.

J'ai rédigé en anglais parce que j'ambitionne aussi de faire la même chose sur en.wikipedia.org mais peut être qu'il faudrait rédiger une version française pour toucher le public de fr.wikipedia.org.

Pa2chant.bis (discutercontributions)

Tu fais un superbe boulot !

PAC2 (discutercontributions)

Merci.

PAC2 (discutercontributions)
.Anja. (discutercontributions)

Mais ces outils sont géniaux ! Ça permet ainsi d'illustrer de manière concrète le fait que les articles de WP renvoie + vers des bio d'hommes que des bio de femmes pendant un éditathon. Merci !

Allweno (discutercontributions)

Bravo @PAC2 et merci pour ces outils supers!

Nattes à chat (discutercontributions)

@PAC2 il y a des liens qui ne marchent plus et je prépare des réponses pour une journaliste pour demain Elle me demande le nombre de femmes avec un article wikipédia par profession - est.ce que tu as déjà travaillé cet aspect ? Avant on obtenait le résultat en un clic avec Denelezeh :/ mais là .....

PAC2 (discutercontributions)

Pour le nombre de femmes avec un article Wikipédia par profession, c'est Denelezh le meilleur outil.

Æpherys (discutercontributions)

Evidemment cette approche pose de nombreuses questions. En particulier, on se sait pas du tout quelle est la "juste proportion" de femmes qui pourraient être citées dans un article. Tout est dit. Considérer qu'il faudrait rajouter des noms pas tant car ce serait pertinent mais car la personne est une femme me semble relever d'un biais bien plus problématique que celui contre lequel on prétend lutter.

C'est tout aussi impertinent et glissant de que recenser l'orientation sexuelle des personnes citées, leurs nationalités ou leur ethnie. Pourquoi pas ? En quoi est-ce bien différent de ces stats de genre ?

Pa2chant.bis (discutercontributions)

C'est gentil de venir répéter trois ans plus tard aux gens qui les ont émises des contraintes dont ils sont conscients. Eh non, tout n'est pas dit avec cette seule phrase. Vous avez raté la précédente : "Par exemple, au 20 janvier: l'article "Science politique" compte 28 liens renvoyant vers des hommes contre 1 lien renvoyant vers 1 femme! l'article "Sociologie" compte 74 liens vers des hommes et 0 liens vers des femmes! l'article "Microéconomie" compte 42 liens vers des hommes et 1 liens vers une femme!" Or on sait par exemple que par une sorte de division du travail, les femmes se retrouvent principalement en microéconomie, tandis que les hommes jugent plus valorisante la macroéconomie, et y sont plus représentés. Mais merci de votre commentaire, qui a tourné en boucle sur le Bistro.

Æpherys (discutercontributions)

Je n'ai pas lu les dates @Pa2chant.bis, et me serais abstenu si je l'avais vu. Après, je maintiendrai le caractère problématique de tout cela, et que cela ait été fait hier ou il y a 3 ans ne change rien sur ce point.

Quant à « votre commentaire, qui a tourné en boucle sur le Bistro », si vous pouviez en dire plus…

Nattes à chat (discutercontributions)

je ne comprends pas le "caractère problématique de tout ça" étant donné que de toute façon tout ajout doit être sourcé.

Nattes à chat (discutercontributions)

Quand à la proportion de femmes dans un article donné, ou le pourcentage de femmes sur WP qu'on peut atteindre en respectant les sources cela reste une question ouverte. je n'en ai qu'une très vague idée. D'un coté sur l'anglophone il y a 400 000 bios de femmes environ, soit deux fois plus que chez nous, mais elles ne sont pas toutes admissibles selon nos critères, de l'autre mes calculs me disent qu'au train où on va on atteindrait toutes choses égales par ailleurs on atteindrait 25% en 2072. Sinon j'ai trouvé ce site https://gendered-news.imag.fr/genderednews/en/ voir notamment ça https://gendered-news.imag.fr/genderednews/en/data/ mais cela ne fait que survoler la question pour nous sur fr-wp. Il nous faudrait des recherches beaucoup plus poussées que ce que l'on a actuellement pour orienter le bateau et trancher. En attendant ce sont les sources qui gouvernent, et il n'a jamais été question de booster sans sources donc je ne comprend pas trop ton souci @Æpherys

Æpherys (discutercontributions)

Bonsoir,

Je résume mes deux critiques, distinctes, dont l'une a été faite ici et l'autre sur le bistro :

  • Sur la diversité de genre des liens d'un article : Je ne vois pas l'intérêt de recenser les genres des personnes citées sur un article. Quel est le but pour LSP ? Rajouter des femmes sur les articles sur lesquels il y en aurait peu ? Et ce pas tant car il s'agirait d'une personne importante pour le sujet de l'article mais car il s'agirait d'une femme ? L'un n'empêche pas l'autre, certes, mais venir contribuer sur un article pour rajouter spécifiquement des femmes ou tout autre personnes pas pour l'intérêt de ce qu'ils ont dit/fait mais pour ce qu'ils sont me semble très discutable. Si sur un article il y a X % d'hommes et Y % de femmes, X % de personnes ceci et Y % de personnes cela, c'est peut-être pas tant car il y aurait un biais à combler mais car sur le présent article, c'est ce qui correspond aux sources et aux encyclopédies en ligne. Je pense qu'il y a peu de personnes qui viennent sur un article pour mettre spécifiquement des hommes en se disant qu'elles contribuent ainsi à invisibiliser les femmes. Cependant, s'il s'agit de simplement rajouter l'hyperlien d'une femme déjà présente sur un article après avoir créer "son" article, c'est très bien, mais je ne vois donc pas l'intérêt de quantifier le pourcentage de femmes sur un article ciblé.
  • La transversalité du projet LSP, qui a pour but de créer des articles sur des femmes, et toute autre "minorité" supposée. Ce deuxième point me semble bien moins problématique que le premier, mais comme ça a été souligné sur le bistro avec humour, créer spéficiquement les pages de femmes députées japonaises dans le but d'avoir plus de femmes me semble impertinent. Wikipédia en français manque cruellement d'articles et je suis de ceux qui aimeraient un assouplissement des critères, donc c'est très bien de créer des articles. Mais il me semble que les députés japonais hommes étaient tout autant des sans pages que les députées japonaises femmes, tout comme toutes les personnalités non francophones ou occidentales tendent à avoir moins d'articles sur WP en français. Si je puis dire, vous créez ainsi un désiquilibre de genre (pour ne pas dire biais) afin de lutter contre un supposé biais de genre, alors qu'en l'occurrence, le "biais" est linguistique voire civilisationnel. Je remarque d'ailleurs que les récents députées françaises, belges, québécoises, tout comme leurs homologues hommes, ont toutes et tous un article. Si le but était simplement de donner une page aux sans pages, on aurait pu s'attendre à la création de pages de députés japonais de tout genre, qui manquent cruellement d'articles. Choisir spécifiquement de développer les articles de certaines personnes parce que femmes, ou parce que X ou parce que Y, me semble discutable, même si rien ne l'interdit en soi et vous en avez le droit.

Bonne soirée,

PAC2 (discutercontributions)

Sur le premier point, mesurer permet de prendre conscience. Denelezh et Humaniki ont permis de mesurer le déséquilibre entre les biographies consacrées à des hommes et les biographies consacrées à des femmes. Mon Gender diversity explorer (https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article?wikipedia=fr.wikipedia.org&article=%C3%89conomie_(discipline)) permet de se poser la même question à l'échelle des entités citées dans un article. Concrètement, ça vient d'une réflexion très concrète sur l'article Économie (discipline). Ça m'a permis d'enrichir l'article autrement. Là où je te rejoins c'est qu'on ne peut pas ajouter artificiellement des liens vers des femmes dans un article. En revanche, on peut orienter ses recherches, trouver des sources de qualité et améliorer et enrichir l'article.

Sur le second point, je n'ai toujours pas vu d'article académique montrant qu'il y a un biais de genre en défaveur des hommes. Le jour où ça existera, on pourra se poser des questions.

Nattes à chat (discutercontributions)

@Æpherys je te rejoins sur le biais linguistique et civisationnel. J'ai par exemple remarqué que les articles sur l'Angleterre et le Royaume Uni sont moins présents (j'ai traduit des lois qui expliquent l'homophobie juridique d'anciens pays colonisés, et je me suis intéréssé aux émeutes de Briston (sujet en plus d'actualité mais peu présent sur fr-wp). J'essaie aussi de travailler sur l'Afrique. Par contre la recherche a largement montré que les femmes sur WP sont toutes choses égales par ailleurs plus notables que les hommes de même profession et profil. Ce qui démontre clairement un biais dans le traitement des sources : celui là on peut y remédier assez facilement.

Répondre à « Mesurer la diversité de genre des liens cités dans les articles »
  NODES
chat 7
INTERN 1
Note 3
Project 1