Bruker:Soulkeeper/Endre no til nb

Endring av domene-prefiks og språkkode fra no til nb - hvorfor og hvordan

rediger
Til leseren: Hvis du syns noe på denne siden er uklart, feil eller mangelfullt, håper jeg du vil ta det opp på diskusjonssiden. Denne siden er et utkast under arbeid. Andre er velkomne til å bidra, men jeg forbeholder meg retten til å leke redaktør. - Soulkeeper (diskusjon) 16. okt. 2016 kl. 14:17 (CEST)

Bakgrunn

rediger

I begynnelsen tillot norsk Wikipedia alle norske målformer. Høsten 2004 ble det opprettet et eget prosjekt for nynorsk. Et halvt år senere avholdt de gjenværende brukerne på no diskusjoner og en avstemning om hvilke målformer som skulle tillates. Beslutningen ble å ikke lenger tillate nynorsk og høgnorsk. Tillatte målformer var heretter bokmål og riksmål.

I 2009 år senere kom temaet om nb kontra no opp på nytt. Etter en lengre diskusjon som ikke førte til konsensus, ble det satt opp en avstemning. Resultatet ble å ikke endre språkkoden.

I 2017 ble autonymet for no korrigert fra «norsk bokmål» til «norsk» i MediaWiki. Fire måneder senere kom endringen til nowiki. Per november 2018 er de norskspråklige Wikipeda-prosjektene fortsatt navngitt som henholdsvis «norsk» og «norsk (nynorsk)» i interwiki-lenkene på samtlige Wikipedia-prosjekter, med unntak av noen sentrale sider på nynorsk-prosjektet hvor lenken til bokmålsprosjektet manuelt har blitt overstyrt til å hete «norsk (bokmål)».

Hvorfor diskusjonen nekter å dø

rediger
  • Nye bidragsytere som ikke kjenner til den gamle striden, vil tidvis snuble over det kuriøse avviket mellom domene-prefiks og tillatte målformer, og nevne det.
  • Noen faste bidragsytere mener at den mest korrekte koden for Wikipedia på bokmål (og riksmål) er nb og at vi bør ta konsekvensen av dette.
  • Språkkodeavviket fører med ujevne mellomrom til tekniske problemer av ulik alvorlighetsgrad. Det er vanskelig å diskutere slike problemer uten å komme inn på årsakene.

Så lenge prosjektet ligger på feil språkkode, vil temaet fortsette å komme opp.

Hvorfor diskusjonen går i ring

rediger

Spørsmålet om domene-prefiks og språkkode er i høyeste grad tekniske spørsmål. I de fleste sammenhenger innser folk at for å ha en kvalifisert diskusjon om tekniske spørsmål må man sette seg inn i det tekniske. Samtidig berører akkurat dette spørsmålet norske målformer. Dette er et tema som mange norskspråklige har sterke følelser om. Noen deltakere viser liten vilje til å sette seg inn i de tekniske aspektene av saken, og diskuterer den som et rent verdi- eller identitetsspørsmål.

Forslag og premisser er dermed ikke nødvendigvis forankret i en forståelse av hva som er teknisk mulig eller fornuftig. Saken berører servere, databaser, søkemotorer, språkkonfigurasjonsfiler, brukergrensesnitt, programmer som skal snakke med hverandre, wikier som skal lenke til hverandre, tekniske standarder som skal muliggjøre alt dette, og drift av det hele. Teknisk orienterte brukere prøver innimellom å realitetsorientere diskusjonene, men ofte blir dette fort glemt eller ikke forstått.

Diskusjonene blir ofte lite fokuserte, lite løsningsorienterte, og tidvis en ren fortsettelse av målstriden.

Språkkodene

rediger

Wikimedia bruker i de aller fleste tilfeller språkkodene definert i ISO 639-standarden,[1] og der det er avvik er det for en stor del meldt inn ønske om endring.[2] Disse språkkodene brukes til å identifisere prosjektene og skjelne dem fra hverandre. Språkkodene brukes som hovedregel også som domene-prefiks (underdomenenavn) på de korresponderende prosjektene.

Norsk språk er i denne standarden representert med hele tre språkkoder. Det er én generell språkkode (makrospråk) som dekker begge/alle norske målformer. I tillegg har de to offisielle norske målformene, bokmål og nynorsk, hver sin spesifikke språkkode.

  • Koden no (makrospråk) står for norsk.
  • Koden nb står for norsk (bokmål).
  • Koden nn står for norsk (nynorsk).

Uoffisielle norske målformer, som riksmål og høgnorsk, har ikke egne språkkoder i ISO 639. Disse blir ofte i praksis sortert under henholdsvis bokmål og nynorsk.

Direktoratet for forvaltning og IKT sier følgende om hvordan man bør bruke de norske språkkodene i nettsider: «Unngå å bruke "no", bruk heller "nb" eller "nn".»[3]

Landskoder

rediger

Vær oppmerksom på forskjellen mellom språkkoder og landskoder.

  • Språkkoder er knyttet til språk, og brukes bl.a. til domene-prefiks av Wikimedia (f.eks. språkkoden sv for svensk, som brukes i f.eks. http://sv.wikipedia.org).
  • Landskoder er knyttet til land, og brukes bl.a. til toppnivådomener på Internett (f.eks. landskoden se for Sverige, som brukes i f.eks. http://google.se). Landskoder har ikke noe med denne diskusjonen å gjøre, men det kan være lett å rote dem inn hvis man ikke er bevisst på forskjellen.

Forslaget om endring av domene-prefiks og språkkode

rediger

Forslaget er todelt, og innebærer å

  • endre språkkoden for dette Wikipedia-prosjektet fra no til nb, og
  • tilsvarende endre domene-prefikset i adressen fra no.wikipedia.org til nb.wikipedia.org.

Dette må gjennomføres på en måte som minimerer negative konsekvenser for funksjonaliteten, for eksisterende innkommende lenker, og for artiklenes plassering i eksterne søkemotorer som Google Søk.

For å gjøre diskusjonene mer overkommelige kan det synes hensiktsmessig å diskutere språkkode og domene-prefiks separat. I praksis har det imidlertid vist seg svært vanskelig å diskutere det ene uten at det andre blir dratt inn. Det skal også som hovedregel være samsvar mellom domene-prefiks og språkkode på Wikipedia[4], og det spørs dermed om det har noe for seg å prøve å skille disse to temaene fra hverandre.

Argumenter for flytting

rediger

Argumentene for flytting kan deles opp i tre:

  1. Nøyaktighet og etterlevelse av standarden
  2. Tekniske problemer forårsaket av brudd med standarden
  3. Nøytralitet og språkpolitisk signaleffekt

Nøyaktighet

rediger

Nøyaktighet er i seg selv en dyd, spesielt for en encyklopedi. Bruken av no for denne wikien feilrepresenterer det faktiske innholdet på wikien. Språkkoden dekker begge de offisielle norske målformene, men brukes her på et prosjekt som kun tillater bokmål (og riksmål).

På andre Wikimedia-prosjekter, f.eks. Wiktionary, står koden no for det norske språket i sin helhet, eller strengt tatt de offisielle målformene bokmål og nynorsk. Dette er i samsvar med Wikimedias valgte standard for språkkoder (ISO 639).

Inkonsekvens

Wikipedia og Wikiquotebokmål er unntakene. I tillegg til å bryte med Wikimedias valgte standard for språkkoder, fører dette til at Wikimedias bruk av de tre norske språkkodene blir inkonsekvent fra prosjekt til prosjekt.

Tekniske problemer

rediger

Unøyaktigheten fører også til tekniske utfordringer som kunne vært unngått. Da no er definert som «norsk», mens dette Wikipedia-prosjektet omtales som «norsk bokmål», må lister overstyres og kode hackes i MediaWiki-programvaren og i Wikipedias oppsett, for å komme rundt dette avviket og vise ønsket språknavn. Disse tiltakene har bivirkninger.

  • Språkkoden no er tildels håndkodet i innholdet som «Norsk bokmål» og ikke «norsk».[5]
  • Noe av den spesialiserte koden for å komme rundt problemet (navn ifølge m:Special:SiteMatrix) vil kunne fjernes hvis språkkoden blir endret.
  • Mange åpne bug-saker på Phabricator kan lukkes, da rotet mellom no og nb er årsaken.

For et eksempel på forvirringen som oppstår, ta en titt på det engelske Wiktionary-oppslaget wikt:en:hop:

  • Før 2017 var språklenken fra det engelske til det norske oppslaget oppgitt som «Norsk bokmål», til tross for at norsk Wiktionary dekker alle (begge) norske målformer og bruker språkkoden no. Dette var en konsekvens av overstyringen av standardoppførselen som var lagt inn for å få språkkoden no til å komme opp som «norsk bokmål», slik at bokmåls-Wikipedia skulle se riktig ut.
  • Etter at denne overstyringen ble fjernet fra MediaWiki i 2017, ble situasjonen motsatt: Språknavnet på Wiktionary er nå riktig («Norsk»), mens språknavnet på Wikipedia er feil (det står «Norsk» men burde stå «Norsk bokmål»).

Det er altså umulig å få riktig språknavn på både Wiktionary og Wikipedia samtidig: Retter man det ene, blir det andre feil, og vice versa. Av prosjekter som har samme språkoppsett som Wiktionary finner man Wikibøker, Wikikilden og Wikinytt.

Hver gang noen skal skrive tilleggsprogramvare, utvidelser eller apper hvor språkkoder eller språknavn benyttes, er det et potensiale for at disse avvikene og den inkonsekvente bruken av språkkodene skal forårsake problemer i brukergrensesnittet eller i tekniske grensesnitt mellom ulike deler av programvaren. Utviklerne må da bruke tid og ressurser på å kartlegge og bøte på disse. Dette medfører også en løpende kostnad ved vedlikehold av programvaren.

Språkpolitisk nøytralitet

rediger
Angående riksmålsrelaterte argumenter, se «Argumenter mot flytting» lenger nede.

Målsetningen til Wikimedia er å gi upartisk tilgang til kunnskap, ikke informasjon fra synspunktet til individuelle politiske samfunn.[6] I Norge har det vært målstrid «i alle år», og målstrid er politisk. Wikimedia-prosjekter bør derfor forholde seg så nøytrale som mulig i forholdet mellom bokmål og nynorsk.

Språkkode

Dagens praksis med å bruke den allmenne norske språkkoden no til å representere bokmål, underkjenner den nynorske målformens status som offisielt likestilt.

Domene-prefiks

At bokmålsprosjektet bruker adressen no.wikipedia.org underkommuniserer at det finnes et søsterprosjekt.

Signaleffekt

Når et Wikimedia-prosjekt benytter språkkoden for et helt språk, mens det samtidig sperrer for en av målformene, signaliserer det en språkpolitisk diskriminering overfor brukerne av den diskriminerte målformen. For bidragsyterne og brukerne av nynorsk Wikipedia blir saken heller ikke bedre av at domene-prefikset også reflekterer språkkoden.

Dette er et lite solidarisk signal å sende ut, spesielt når løsningen er så enkel som å bytte språkkode. Det sømmer seg dårlig for et prosjekt som har politisk nøytralitet som en grunnleggende del av målsetningen.

Alternativer

rediger

Det finnes to reelle alternativer:

  1. La wikien være på no med uendret innhold. Dette løser ikke de nevnte problemene.
  2. Flytte wikien til nb med uendret innhold. Dette løser de nevnte problemene.

Det tredje alternativet er i praksis uaktualt: Å la wikien være på no og tillate nynorsk igjen. Dette ville løst de problemene som er tatt opp her, men det ville samtidig ha skapt en mengde andre problemer. «Ingen» ønsker dette (med forbehold om formodentlig retoriske unntak).

Gjennomføring

rediger

Endring av språkkoden kan gjøres uavhengig av omdirigering av domenet. Det mest naturlige er kanskje å rette språkkoden først, og så diskutere og eventuelt gjennomføre endring av domeneprefikset ved neste korsvei.

De som skal utføre jobben(e) må vurdere hvilke forberedelser som må gjøres, og i hvilken grad det er nødvendig å simulere prosedyren på testservere først. I praksis kan endringen(e) gjennomføres i følgende trinn (omtrentlig):

Endre språkkode

rediger
  1. Endre språkkoden for bokmåls-/riksmåls-prosjektet i MediaWiki-økosystemet fra no til nb.
    Dette vil i en kort periode kunne føre til feil visning av språknavnene «norsk» og/eller «norsk bokmål», både i interwiki-lenker og andre steder.
    Det kan potensielt forstyrre enkelte applikasjonsgrensesnitt inntil eksisterende overstyringer/hacks ryddes ut av kode og konfigurasjon.
  2. Rydde bort overstyringer av språknavn som tidligere har blitt innført i Wikimedia-prosjekter for å dekke til språkkode-avviket på bokmåls-Wikipedia.
  3. Rydde bort de mest synlige eller brysomme overstyringer og hacks fra innstillinger og kildekode i tilleggsfunksjoner, apper o.l.

Endre domeneprefiks

rediger
  1. Endre domenenavet fra no.wikipedia.org til nb.wikipedia.org, og omdirigere det gamle domenenavnet til det nye via en HTTP 301 permanent omdirigering.
    Teknisk sett er dette fort gjort, og skal ha relativt få og små konsekvenser i overgangsfasen.

Etter at selve flyttingen er utført, bør følgende endringer utføres innen rimelig tid:

  1. Konfigurere Wikidata til å godta nbwiki i stedet for nowiki for interwiki-lenker. Oppdatere eksisterende interwiki-lenker på Wikidata tilsvarende.
    Dette haster ikke, da HTTP 301-omdirigeringen ivaretar lenkene.
  2. Rydde bort de mest synlige eller brysomme overstyringene og hacks fra innstillinger og kildekode i tilleggsfunksjoner, apper o.l.

Etter at dette er ferdig skal alt fungere som før. Mange wikipedianerne vil kanskje bruke litt tid på å venne seg til den nye språkkoden og domenenavnet, men omdirigeringen vil gjøre den praktiske innvirkningen på brukeropplevelsen minimal i daglig bruk. Enkelte vil være mer opptatte med å lukke bug-saker som ikke lenger er aktuelle, og rydde bort foreldede overstyringer, hack og unntak fra kildekoden. Det vil trolig også bli noe aktivitet rundt å oppdatere brødtekstlenker på diverse prosjekter, selv om dette ikke haster. Lenker fra eksterne sider (ikke Wikimedia-sider) til Wikipedia, samt hardkodede språklenker i brødtekst må oppdateres manuelt hver for seg. Dette vil ta årevis, men omdirigeringen vil sørge for at full funksjonalitet blir ivaretatt i mellomtiden.

Omdirigering av domene

rediger

I dag er nb omdirigert til no. Går du f.eks. på http://nb.wikipedia.org/wiki/Pølse, blir du sømløst sendt til http://no.wikipedia.org/wiki/Pølse. En endring fra no til nb vil innebære at denne omdirigeringen simpelthen snues andre veien.

For å bevare rangen hos søkemotorer (altså «viktigheten» eller «statusen» som gjør at man kommer høyt oppe på resultatlisten) o.l., bør omdirigeringen også gjøres til en «HTTP 301 permanent omdirigering». Dette innebærer at nettlesere og søkemotorer får et signal om at den gamle adressen ikke lenger er gyldig, og at den skal erstattes av den nye adressen.

Omdirigeringen må også være permanent i den forstand at vi ikke fjerner den så lenge den fortsatt har en betydelig funksjon. Det vil ta mange år før omdirigeringen ikke lenger er nødvendig. Frem til man kan sannsynliggjøre at omdirigeringen ikke lenger er nødvendig, bør funksjonaliteten med artikkelvis omdirigering fra no-domenet til nb være «fredet». Altså bør det være garantert at alle artikler og navigasjonssider (inkludert hovedsiden) som eksisterer på no.wikipedia.org idet språkkoden og domene-prefikset endres, vil bli omdirigert til tilsvarende side på nb.wikipedia.org så lenge «fredningsperioden» varer.

Det vil være upraktisk å på dette tidspunkt bestemme «fredningsperiodens» varighet, fordi det ville kreve sikker kunnskap om fremtiden. Det er sannsynlig at omdirigeringen må eksistere i flere år, men en varighet på flere tiår kan heller ikke utelukkes. Vurderingen bør derfor gjøres fortløpende, og være basert på et solid datagrunnlag.

Argumenter mot flytting

rediger

Her er en oversikt over noen vanlige argumenter mot flytting, med kommentarer om hvorfor de ikke nødvendigvis er tungtveiende:

Praktisk
  • Det er litt jobb.
    Men ikke voldsomt mye, spesielt ikke sammenlignet med de løpende vedlikeholdskostnadene av å avvike fra standarden.
  • Søkemotor-rang kan lide litt en periode.
    Men vi driver med folkeopplysning, og er ikke avhengig av klikk for å overleve. Det går uansett fort over.
  • Søkemotor-rang kan bli permanent skadelidende.
    301-omdirigering ivaretar i verste fall 90%-99% av rangen.[7], i beste fall 100%[8]
  • Applikasjonsgrensesnitt kan bryte sammen.
    Så lenge Wikimedias tekniske stab vet hva de driver med (noe som er sannsynlig), skal de tekniske konsekvensene av en flytting være håndterbare. Wikimedia er basert på åpen kildekode. Samfunnet skrev koden, la inn unntak for «særegenheter», og skal klare å rydde i dem. Dette sorterer under vedlikehold.
Arbeidsmiljø
  • Noen vil bli misfornøyde.
    Noen er misfornøyde med dagens situasjon. Man kan åpenbart ikke gjøre alle til lags.
  • Nytt domene-prefiks og ny språkkode vil være uvant i begynnelsen.
    Men hvis man skriver feil får det ingen praktisk konsekvens for arbeidsflyten.
Identitet
  • Folk forbinder koden no med bokmål/riksmål.
    Folk forbinder koden no med norsk (språkkode) og Norge (landskode), ikke med målformer. Det hender at brukere oppretter artikler på nynorsk på dette prosjektet. Det er ikke utenkelig at språkkode-forvirringen bidrar til at de tror det er tillatt.
  • Merkevaren no.wikipedia.org vil bli skadelidende.
    Merkets identitet er i svært stor grad wikipedia. Toppnivådomenet org og domene-prefikset no er mindre viktig. Det er allment kjent at Wikipedia er et flerspråklig prosjekt.
  • Den nye språkkoden vil ikke representere riksmål på en tilstrekkelig god måte.
    Det finnes ingen ISO 639-kode som representerer riksmål på en fullgod måte. Selv om riksmål mangler offisiell status, vil målformen fortsatt være tillatt på bokmåls-prosjektet, på tilsvarende måte som høgnorsk er og blir tillatt på nynorsk-wikipedia.
    Riksmål ligger så tett på bokmål at det ofte er umulig å skjelne dem fra hverandre. F.eks. skrev riksmålsmannen Tor GuttuRiksmålsforbundets egne nettsider at «riksmål kan betraktes som en delmengde i bokmålet».[9] Riksmålsforbundets sider benytter også språkkoden nb, sammen med landskoden NO (lang="nb-NO"). Dette kan man selv bekrefte ved å besøke siden og velge «Vis kildekode» i nettleseren. Å hevde at det vil være unøyaktig å la dette Wikimedia-prosjektet ligge under språkkoden nb på bakgrunn av at prosjektet også tillater riksmål, fremstår dermed som et forsøk på å være helligere enn paven.
    I lys av dette er det vanskelig å se argumentet om riksmål som noe mer enn et forsøk på avsporing.
Lenkeråte
  • Lenker vil bli brutt.
    301-omdirigering holder lenker i live.
  • Lenker på papir blir aldri oppdatert.
    Og tastes sjelden inn på en datamaskin. Når det skjer, er det ikke uvanlig å taste adressen inn i en søketjeneste i stedet for et adressefelt.
    At papir aldri blir oppdatert betyr også at papir blir utdatert i større grad, og raskere, enn levende nett-dokumenter. Å ivareta lenker fra utdaterte dokumenter er mindre viktig enn å ivareta lenker fra gjeldende/gyldige dokumenter.
    Problemstillingen synes marginal, men det vil uansett være hensiktsmessig å vente med å ta stilling til den, til man eventuelt skal vurdere oppheving av fredningen av omdirigeringen.
    • Lenker på papir i akademiske avhandlinger vanskeliggjør referansesjekk.
      Wikipedia regnes stort sett ikke som en gyldig kilde i akademisk sammenheng.
      Problemstillingen synes søkt, men det vil uansett være hensiktsmessig å vente med å ta stilling til den, til man eventuelt skal vurdere oppheving av fredningen av omdirigeringen.

Se også

rediger

Referanser/noter

rediger
  NODES
INTERN 1
Note 2