Apertium
Apertium er et maskinoversettelsessystem som blir utviklet med støtte fra den spanske regjeringa, regjeringa i Catalonia, og Universitetet i Alicante. Det er fri programvare, publisert under GNU GPL.
Apertium | |||
---|---|---|---|
Distributør(er) | Google Play | ||
Nyeste versjon | 3.9.4 (28. desember 2023)[1] | ||
Kodelager | https://github.com/apertium | ||
Skrevet i | C++,[2] Java | ||
Type | Regel-baseret maskinoversettelse | ||
Lisens | GPLv2[3] | ||
Nettsted | www.apertium.org (mul) | ||
Apertium startet som et av maskinoversettelsessystemene i prosjektet OpenTrad og var opprinnelig laget for å oversette mellom språk som var nært i slekt, men det har senere blitt utvidet til å behandle språk med større forskjeller, som for eksempel baskisk→spansk. Systemet er modulært, og for å legge til et nytt språkpar er det nok å legge til språklige data (oversettelsesordbok, regler) i et veldefinert format (XML).
Apertium fungerer nå for de romanske språka i Spania, kastillansk, katalansk og galisisk, og for engelsk, portugisisk, fransk, oksitansk og rumensk.
Maskinoversettelsen i Apertium er basert på overføring av grammatisk struktur, og bruker endelige tilstandsautomater for alle leksikalske transformasjoner og ordklassetagging, og føringsgrammatikk for regelbasert ordklassedisambiguering en skjult Markov-modell for statistisk disambiguering. Regler blir også brukt for leksikalsk seleksjon, dvs. betydningsdisambiguering for valg av beste oversettelse etter at den morfologisk analysen er utvetydig, og for oversetting av idiomatiske uttrykk.[4]
Maskinoversettelse mellom nynorsk og bokmål
redigerInnenfor Apertium-ramma er det satt i gang arbeid med maskinoversettelse mellom nynorsk og bokmål, apertium-nno-nob.[5] Versjon 1.5.0 kan testes på hjemmesiden deres.
Språkoversettingspar
redigerListe over noen av språkene som lar seg oversette med Apertium (oppdatert liste på http://wiki.apertium.org/wiki/Main_Page ).
Aragonesisk an | Asturiansk ast | Baskisk eu | Breton br | Bulgarsk bg | Katalansk ca | Dansk da | Engelsk en | Esperanto eo | Fransk fr | Galisisk gl | Islandsk is | Italiensk it | Makedonsk mk | Bokmål nb | Nynorsk nn | Occitan oc | Portugisisk pt | Rumensk ro | Spansk es | Svensk sv | Walisisk cy | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Aragonesisk | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
Asturiansk | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
Baskisk | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei |
Bretonsk | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Bulgarsk | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Katalansk | Nei | Nei | Nei | Nei | Nei | — | Nei | Ja (⇄) | Ja (→) | Ja (⇄) | Nei | Nei | Ja (←) | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Ja (⇄) | Nei | Nei |
Dansk | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Nei | Nei | Nei | Ja (←) | Nei |
Engelsk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | — | Ja (⇄) | Nei | Ja (⇄) | Ja (←) | Nei | Ja (←) | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Ja (←) |
Esperanto | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei | Ja (⇄) | — | Ja (←) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (←) | Nei | Nei |
Fransk | Nei | Nei | Nei | Ja (←) | Nei | Ja (⇄) | Nei | Nei | Ja (→) | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei |
Galisisk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Ja (⇄) | Nei | Nei |
Islandsk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Italiensk | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Makedonsk | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei |
Bokmål | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei |
Nynorsk | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | — | Nei | Nei | Nei | Nei | Nei | Nei |
Oksitansk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Nei | Ja (⇄) | Nei | Nei |
Portugisisk | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | — | Nei | Ja (⇄) | Nei | Nei |
Rumensk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — | Ja (←) | Nei | Nei |
Spansk | Ja (⇄) | Ja (⇄) | Ja (←) | Nei | Nei | Ja (⇄) | Nei | Ja (⇄) | Ja (→) | Ja (⇄) | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Ja (←) | — | Nei | Nei |
Svensk | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (⇄) | Ja (⇄) | Nei | Nei | Nei | Nei | — | Nei |
Walisisk | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Ja (→) | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | Nei | — |
Fotnoter
rediger- ^ https://github.com/apertium/apertium/releases/tag/v3.9.4; utgivelsesdato: 28. desember 2023.
- ^ «The apertium Open Source Project on Open Hub: Languages Page». Open Hub. Besøkt 18. juli 2018.
- ^ https://sourceforge.net/projects/apertium/; SourceForge; besøksdato: 24. september 2016.
- ^ Khanna, Tanmai; Washington, Jonathan N.; Tyers, Francis M.; Bayatlı, Sevilay; Swanson, Daniel G.; Pirinen, Tommi A.; Tang, Irene; Alòs i Font, Hèctor (1. desember 2021). «Recent advances in Apertium, a free/open-source rule-based machine translation platform for low-resource languages». Machine Translation. 4 (på engelsk). 35: 475–502. ISSN 1573-0573. doi:10.1007/s10590-021-09260-6. Besøkt 16. oktober 2023.
- ^ [1]
Litteratur
rediger- Corbí-Bellot, M. et al. (2005): «An open-source shallow-transfer machine translation engine for the romance languages of Spain» i Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, ss. 79-86
- Armentano-Oller, C. et al. (2006): «Open-source Portuguese-Spanish machine translation» i Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], ss. 50-59.
Eksterne lenker
rediger- (mul) Offisielt nettsted
- (en) Apertium – kategori av bilder, video eller lyd på Commons
- nordsamisk→bokmål (nyeste "SVN"-utgave) utviklet i samarbeid med Sámi Giellatekno
- Testversjoner av andre samiske/norske/finske språkpar utviklet i samarbeid med Sámi Giellatekno
- Apertium intern-Wiki
- Norske språkpar i Apertium (utviklingsinformasjon)