Wiktionnaire:Bots/Statut/ChrisaixBot

  • Nom du propriétaire : Chrisaix
  • But du bot : uniquement création de nouveaux articles en langues étrangères à partir de listes diverses (notamment Freelang) et complétées par mes recherches personnelles (entre autres le Wikipedia de la langue concernée). Les articles contiennent des mots originaux et leurs flexions (déclinaisons, conjugaisons).
  • Script utilisé : python.
  • Déjà présent sur, avec statut de bot : aucun autre projet.
  • Déjà présent sur, sans statut de bot : Wiktionnaire.
  • Remarques : De nombreuses listes sont en cours de création dans plusieurs langues (slovène, russe, biélorusse, ukrainien, tatar, kazakh, haut-sorabe, ligure, islandais, allemand...) et d'autres sont prévues (flexions pour le tchèque, le latin et le polonais). Soit plusieurs dizaines de milliers d'articles... J'avais déjà préparé ce genre de liste (151.000 noms de famille en russe, 4735 flexions en tchèque et 12.278 articles en ukrainien - rentrées par Dakdada -, plus celles que j'avais créées sous le pseudo de Thorgal en cherokî, tchétchène et afar par exemple).
  • Date et heure : 8 janvier 2010 à 0 h 04.

  Pour

  1.   Pour évidemment. --Eiku (d) 8 janvier 2010 à 07:06 (UTC)[répondre]
  2.   Pour mais un petit {{-décl-}} serait aussi le bienvenue, comme dans abstrakt#Luxembourgeois. JackPotte 8 janvier 2010 à 12:02 (UTC)[répondre]
  3.   Pour Je change mon vote en pour, car je ne doute pas de tes motivations. Je pense que le Wiktionnaire a besoin du travail que tu proposes de lui fournir. Bonne chance, tu en auras besoin   -- Quentinv57 9 janvier 2010 à 22:08 (UTC)[répondre]
  4.   Pour Description fort encourageante. Bogorm 13 janvier 2010 à 15:11 (UTC)[répondre]
  5.   Pour Compte tenu des engagements qu'a pris Chrisaix (voir plus bas). Stephane8888 Discuter 14 janvier 2010 à 21:55 (UTC)[répondre]

  Contre

  1.   Contre. Je ne doute aucunement de la bonne volonté et des ambitions de Chrisaix. Mais les évènements de la journée m'ont fait changer d'avis : en jetant un coup d'oeil aux RC, je retrouve un bot fou, dont le dispositif d'arrêt est inefficace [1], et qui est drôlement bien suivi par son dresseur pour un bot en période de test ! [2] [3] [4]. -- Quentinv57 8 janvier 2010 à 16:02 (UTC)[répondre]
    Vote changé en pour -- Quentinv57 9 janvier 2010 à 22:08 (UTC)[répondre]
  •   Contre tant qu'il n'aura pas accepté les règles concernant le copyright (voir discussions ci-dessous). Le bot ne doit surtout pas servir à recopier sans autorisation des informations venant de sites à licence non libre. Lmaltier 9 janvier 2010 à 22:14 (UTC)[répondre]

  Neutre

  1.   Neutre OK pour inclure des flexions et les articles non recopiés de sources protégées. (voir discussion plus bas). Stephane8888 Discuter 12 janvier 2010 à 14:05 (UTC) Autre inquiétude : « Peux-tu séparer les flexions des articles [incriminés remplacé par:] recopiés de sources protégées ? ». Stephane8888 Discuter 13 janvier 2010 à 14:21 (UTC)[répondre]
    Oui, sans problème, mais je n'aime pas ce terme de "incriminé". Pourquoi emploies-tu ce mot ? Chrisaix 13 janvier 2010 à 14:57 (UTC)[répondre]
    Je suis content que ça ne pose pas de problème de séparer flexions et articles. Incriminé ? je voyais ce mot comme synonyme de « suspect (de violat° de copyright) ». Il est sans doute trop fort, tu as raison. Stephane8888 Discuter 14 janvier 2010 à 21:32 (UTC) P.S. : Suite à ta réponse rassurante (voir plus bas) je vote Pour ton robot. N'hésite pas à nous demander conseil pour rédiger la demande aux auteurs. Non pas qu'on rédige mieux que toi, mais parce que l'enjeu est de taille, qu'on trouvera peut être d'autres arguments (proposition d'un modèle, demande collégiale, etc) pour rassurer l'auteur, et qu'à plusieurs on peut, éventuellement, mieux apprécier l'impression que fera une telle demande. Stephane8888 Discuter 14 janvier 2010 à 21:49 (UTC)[répondre]
C'est une aide que j'apprécie à sa juste valeur, et je serais heureux de recevoir des conseils de ta part ou de la part d'autres contributeurs. Chrisaix 14 janvier 2010 à 22:59 (UTC)[répondre]
On peut déjà s'inspirer de w:Wikipédia:Demande d'autorisation d'auteur. Je propose qu'on rédige la page Wiktionnaire:Demande d'autorisation d'auteur. (Je vais de ce pas importer celle de WP). Stephane8888 Discuter 15 janvier 2010 à 08:11 (UTC)[répondre]

  Discussion

Attention aux dictionnaires Freelang et autres dictionnaires sur Internet. Prouver une violation de copyright pour un dictionnaire bilingue est souvent moins évident mais, malgré tout, deux choses sont strictement interdites :

  • récupérer leur nomenclature : la sélection des mots est une valeur ajoutée importante d'un dictionnaire. Si, dans une langue, on a la même liste de mots qu'un dictionnaire Freelang (ou autre), on risque d'avoir des ennuis (des dictionnaires ont déjà eu des ennuis pour ça).
  • et, bien sûr, récupérer leurs définitions originales.

Un exemple (la rédaction date peut-être de l'époque de Thorgal) : кисловатый, apparemment recopié de http://dic.academic.ru/dic.nsf/fre_rus/93944/%D0%BA%D0%B8%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%82%D1%8B%D0%B9 . C'est ce genre de chose qu'il ne faut pas faire. Lmaltier 8 janvier 2010 à 18:07 (UTC)[répondre]

Concernant кисловатый, ce n'est pas sur ce site que j'ai récupéré la traduction, mais sur un autre. Je ne suis donc pas le seul à l'avoir recopiée  . Il me semble d'ailleurs l'avoir vue à plusieurs reprises dans d'autres dictionnaires en ligne. Je ne crois pas qu'en traduisant un mot pour un mot, on ait encore beaucoup de "traductions originales", comme tu dis. Tu prends vingt dictionnaires sur Internet, ils ont souvent tous la même traduction pour les mots. J'ai pu le voir moi-même après en avoir cherché beaucoup (entre autres à partir de Lexilogos, qui est entre parenthèses un site génial)... Pour ces adjectifs en russe, je me sers avant tout du wiktionnaire russe et d'un site russe encyclopédique. Ce qui veut dire que je crée souvent moi-même la traduction. Maintenant, si j'en trouve une toute faite, je ne vais pas non plus cracher dessus... Concernant les listes de Freelang, cela fait très longtemps que je m'en sers de base, et déjà plusieurs de leurs lexiques ont été enregistrés ici. Mais ce ne sont que des bases. Je complète ces listes en allant sur les autres wiktionnaires (notamment en anglais et en russe, ils ont pas mal de choses) et sur le Wikipedia de la langue en question. Pour te donner un exemple, le dictionnaire slovène-français Freelang contient 5064 mots. Actuellement, dans mon lexique, j'en suis à 10864, soit 5800 mots que j'ai rajoutés (hors flexions, bien sûr), et je n'en suis qu'à la lettre D. Enfin, il a été décidé de ne plus mettre la référence à Freelang justement pour éviter les problèmes potentiels. Il faudra d'ailleurs éliminer toutes celles qui existent. Petit détail : кисловатый a été créé il y a cinq jours. Chrisaix 8 janvier 2010 à 18:28 (UTC)[répondre]
Autre chose encore : les noms de famille russes provenaient en grande majorité du wiktionnaire russe, et une petite partie provenait d'un site sur les noms de famille russes. Les flexions en tchèque ont été créées de toutes pièces. Les mots ukrainiens provenaient du wiktionnaire russe, mais comme ils n'avaient pas de définitions (tu étais contre le fait de les rentrer tels quels, et tu avais entièrement raison), je me suis servi d'un dictionnaire russe-ukrainien datant des années 50 que j'ai récupéré sur Internet, ainsi que d'un dictionnaire en ligne russe multilingue. Freelang est loin d'être ma seule source d'inspiration. Chrisaix 8 janvier 2010 à 18:37 (UTC)[répondre]
Concernant les nomenclatures Freelang, je suis certain que Chrisaix a largement étoffé celles qui lui ont servi de base. Ce qui m'inquiète davantage c'est la recopie de définition. (et que d'autres sites soient en infraction ne change rien) Je connais la formidable puissance de travail de Chrisaix/Thorgal. Mais (@Chrisaix) certaines de tes phrases sont incomplètes pour certaines, troublantes pour d'autres :
  • « une petite partie provenait d'un site sur les noms de famille russes » : Lequel ? Est-il libre de droits ?
  • « Les mots ukrainiens provenaient du wiktionnaire russe, mais comme ils n'avaient pas de définitions [...], je me suis servi d'un dictionnaire russe-ukrainien datant des années 50 que j'ai récupéré sur Internet, ainsi que d'un dictionnaire en ligne russe multilingue. » : Quel dictionnaire russe-ukrainien ? Quel dictionnaire en ligne russe multilingue ? Sont-ils libres de droits ?
Quand la référence n'est qu'une référence on l'indique (TLFi, ...). Quand l'ouvrage est (ou est devenu) libre, on peut, en plus, le recopier avec mention de la source (Littré, DAF8, ...). Quand l'ouvrage n'est pas libre, on doit seulement l'utiliser comme référence, surtout pas comme source. Les dicos Freelang sont (en gros) des listes de traductions. Une mention à Freelang est acceptable pour valider un sens, une traduction. Ce qui est interdit c'est de créer beaucoup (ou tous) les articles que contient la base Freelang. Retirer la référence n'est pas suffisant, c'est les articles qui faudraient retirés... Les nombreux dicos Freelang sont crées (semble-t-il) par des amateurs, mais nombre d'entre eux sont sous copyright. Pourquoi ne pas demander l'autorisation à leur créateurs ? ou choisir ceux qui sont libres. Freelang n'a sans doute pas le même service juridique que Larousse ou Robert (...), ni la même autorité vis à vis d'un juge, mais pourquoi faire prendre le risque au Wiktionnaire d'être interdit de publication (comme Wikiquote il y a 2 ans environ), ou simplement d'être taxé de pillage, en trahissant ces auteurs de dictionnaires (autres membres de la "communauté lexicographiques") ? Regardes comme "nos" contributeurs réagissent quand nous découvrons un site miroir du Wiktionnaire. Même avec mention de la source, ils sont parfois scandalisés alors que c'est parfaitement admis par notre licence. Je ne suis pas contre ton robot mais seulement (et c'est déjà utile et précieux) pour inclure des flexions, et des articles non recopiés. Stephane8888 Discuter 12 janvier 2010 à 14:00 (UTC)[répondre]
L'auteur du dico slovène(©) de Freelang et François Alby (de Versailles), il y a son mail. Ce gars a déjà fait d'autres dicos de Freelang (afar, gaélique irlandais, gaélique écossais, géorgien, maltais, romanche, alsacien, catalan, bulgare, suédois). Compte tenu du nombre de langues, il doit sûrement partir de supports existants. Lui demander l'autorisation permettrait peut être de régler notre problème. La recopie est vraiment condamnable sur des articles comme alarmirati (du slovène) qui reprend les 4 termes de la déf de Freelang. Remarque : le modèle {{R:Freelang}} est présent dans moins de 600 pages du Wiktionnaire. La mention Freelang et le lien ne suffisent pas puisqu'il ne s'agit que du logiciel et non de la base. Mieux vaudrait un modèle par base de type {{R:Freelang:slovène}}. Stephane8888 Discuter 12 janvier 2010 à 23:03 (UTC)[répondre]
J'ai beaucoup réfléchi aux problèmes que posent ces listes de Freelang. Afin de rassurer tout le monde, j'ai décidé de procéder différemment. 1°) Je vais prendre moi-même contact avec François Alby, ainsi qu'avec les autres auteurs pour leur demander l'autorisation d'exporter leurs listes sur le wiktionnaire. Je ne rentrerai pas ces listes en cas de non réponse ou de réponse négative. Je m'engage également à ne pas rentrer de liste trouvée sur Internet sans autorisation écrite des auteurs. 2°) Je me servirai désormais des catégories "Mots traduits en ..." pour créer des listes, ainsi que des wiktionnaires étrangers et de Wikipedia. Ainsi, il n'y aura plus aucun problème de droit d'auteur ni de violation de copyright. 3°) Mon robot servira également à compléter les flexions des mots existant ici dans différentes langues, du moins celles sur lesquelles je peux travailler. Il y a déjà tellement à faire de ce côté-là... J'espère que ces décisions rassureront et que je pourrai bientôt mettre ce robot au service de ce projet. Chrisaix 14 janvier 2010 à 13:30 (UTC)[répondre]

  Résultat

5 Pour, 1 Contre, et les 7 jours du vote sont dépassés. Le statut de Bot est donc accordé à ChrisaixBot. Stephane8888 Discuter 17 janvier 2010 à 13:37 (UTC)[répondre]

  NODES
dada 1
dada 1
orte 2