Báze (lineární algebra)
Práci s vektorovými prostory i samotnými vektory lze velmi ulehčit zavedením pojmu báze vektorového prostoru (krátce jen báze, angl. basis, pl. bases). Jedná se o množinu jistým způsobem výjimečných vektorů z daného vektorového prostoru, pomocí níž jsme schopni vyjádřit libovolný vektor tohoto prostoru. Pojem báze úzce souvisí s pojmem dimenze vektorového prostoru. Zatímco dimenze nám říká, kolik parametrů potřebujeme na popsání libovolného vektoru v daném prostoru, báze je množina vektorů, ze kterých jsme schopni tento vektor sestrojit, známe-li tyto parametry.
Motivace
editovatNejsnáze je pojem báze vektorového prostoru nahlédnutelný v případě prostoru šipek, fyzikálních vektorů. Pro jednoduchost uvažujme množinu všech šipek v rovině. Tato množina se dá vyjádřit jako vektorový prostor , kde součtu dvou vektorů odpovídá složení dvou šipek, více viz oddíl Fyzikální vektory v článku Vektorový prostor či oddíl Geometrická interpretace v článku Lineární kombinace.
Mějme pro začátek jednu (nenulovou) šipku v rovině, kterou si označme jako . Aniž bychom cokoli věděli o vektorových prostorech, můžeme se na celou věc dívat čistě geometricky a v rovině zakreslit dvě přímky, které jsou na sebe kolmé a které procházejí bodem, z něhož vychází naše šipka . Těmto dvěma přímkám budeme říkat osy, jejich průniku počátek a celému celku dvou přímek pak souřadnicová soustava. Pro přehlednost si přitom jednu z os označme písmenem x a druhou písmenem y. Souřadnicová soustava nám umožňuje zavést jednoduchý způsob, jak naši šipku popsat pomocí dvou čísel. Konkrétně, nejprve si vykresleme kolmici na osu x tak, aby protínala konec šipky. Vzdálenost paty této kolmice od počátku soustavy souřadnic pak chápeme jako x-ovou souřadnici šipky, viz Obr. 1. Stejně postupujeme i pro osu y. Obdrželi jsme tak pro naši šipku dvojici čísel, kterým říkáme souřadnice šipky (v dané souřadnicové soustavě). Když si teď do roviny přikreslíme libovolnou další šipku, tak jsme jí stejným způsobem schopni popsat pomocí dvou čísel.
Tento způsob popisu šipek pomocí dvojic čísel je velmi názorný a jednoduchý. Rádi bychom ho proto přesunuli i do oblasti obecných vektorových prostorů. Zde ale nevíme, co znamená vzdálenost paty kolmice od počátku souřadnic, protože na vektorovém prostoru není nic jako vzdálenost definováno. (Nehledě na to, že tam není definována ani přímka, ani průsečík, ani pata kolmice.) Abychom uspěli, tak musíme naši představu souřadnicových os vystavět s pomocí pojmů, které jsou nám v obecném vektorovém prostoru k dispozici. Vraťme se k našemu příkladu šipek v rovině. Dosud jsme zde měli zavedeny dvě souřadnicové osy a každý vektor jsme popsali pomocí dvou souřadnic, viz Obr. 1. Víme navíc, že složením dvou šipek dostaneme jejich výslednici, kteroužto přitom můžeme chápat jako jejich součet. (Souřadnice výslednice totiž obdržíme tak, že sečteme souřadnice původních dvou šipek, více viz oddíl Fyzikální vektory v článku Vektorový prostor.) Vektor z příkladu výše tedy můžeme chápat i jako součet dvou jistých vektorů, a . Vektor přitom leží na ose x a podobně vektor leží na ose y, viz Obr. 2. Platí tedy rovnost
Pokud nyní vektor dvakrát prodloužíme, obdržíme vektor , jenž lze vyjádřit jako součet vektorů a . Analogicky bychom postupovali i pro libovolný násobek vektoru dostávajíce
kde . Když bychom nyní vektor pootočili a obdrželi tak vektor , jak je znázorněno na Obr. 3, tak se odpovídajícím způsobem změní i oba vektory a do tvaru a , tedy
Je tak vidět, že ať vektor zkrátíme, prodloužíme či natočíme, tak lze výsledný vektor vždy vyjádřit pomocí původních vektorů a jako jejich lineární kombinaci. V rovině jsme ale schopni jakýkoliv vektor vyjádřit pomocí vhodného natočení či prodloužení/zkrácení vektoru . Dostáváme tak, že libovolný vektor v rovině lze popsat jako jistou lineární kombinaci vektorů a způsobem
pro jisté koeficienty .
V tuto chvíli tedy můžeme nadobro opustit náš pomocný pojem souřadnicových os, souřadnicové soustavy a souřadnic vektoru v této soustavě. Místo toho si hned od počátku můžeme v rovině zavést dva pevně dané vektory, které si označíme a . Jak jsme právě viděli, pomocí těchto vektorů jsme schopni vyjádřit libovolný vektor roviny jako jejich lineární kombinaci. Koeficienty této lineární kombinace přitom nazveme našimi novými souřadnicemi. Souřadnicemi, kterými lze popisovat vektory v obecném vektorovém prostoru, protože k jejich zavedení nebylo potřeba nic kromě pojmu lineární kombinace. Tyto souřadnice neudávají vzdálenost od počátku soustavy souřadnic jako ve výše zmíněném případě, ale jedná se o čísla, kterými když vynásobíme naše dva pevně zadané vektory a tyto pak sečteme, tak dostaneme žádaný vektor. Tyto pevně zadané vektory, zde tedy a , pak nazýváme báze prostoru šipek v rovině.
Jak vidno, vektory a můžeme zvolit vícero možnými způsoby, a přitom lze jimi stále popsat libovolný vektor v rovině. Jedná se o obecnou vlastnost báze – za bázi můžeme zvolit vícero sad vektorů. Zde se ale může vyskytnout obtíž, když vektor zvolíme tak, že je roven násobku vektoru a oba tak směřují tímtéž směrem (popřípadě až na znaménko). Není těžké si uvědomit, že v takovémto případě nejsme schopni popsat vektor v rovině, který se od jejich směru odchyluje. Abychom předešli podobným situacím, musíme naložit na definici báze podmínku, že žádný vektor báze nesmí jít vyjádřit pomocí ostatních vektorů báze. Matematicky je tento požadavek vyjádřen slovy, že báze musí být lineárně nezávislá množina vektorů. V obecném vektorovém prostoru bychom také mohli být na pochybách, kolik vektorů vlastně potřebujeme k popisu celého prostoru. Neboli, kolik vektorů tvoří bázi. I v případě vektorů v rovině jsme totiž mohli každý vektor vyjádřit ne jako lineární kombinaci dvou vektorů, ale třeba tří, čtyř, pěti. Požadujeme tedy ještě, abychom do báze nevybírali zbytečně mnoho vektorů. Chceme tedy vybrat jen tolik vektorů, kolik je k popisu vektorového prostoru nezbytně potřeba. Tento požadavek lze vyjádřit opět pomocí lineární nezávislosti. Pokud máme lineárně závislý soubor vektorů, kterými popisujeme vektorový prostor, tak z tohoto souboru můžeme nejméně jeden vektor vyjmout a přitom budeme stále schopni popsat celý prostor. Pokud máme lineárně nezávislý soubor, pak z něho už nelze žádný vektor vyjmout, aniž bychom se neochudili o možnost popisu celého prostoru.
Shrňme si nakonec základní vlastnosti, které musí námi vybrané vektory z vektorového prostoru mít, aby mohli dohromady tvořit bázi. Jak jsme viděli výše, tak chceme, aby šel každý vektor z vektorového prostoru vyjádřit jako lineární kombinaci námi vybraných vektorů. Množina všech lineárních kombinací daných vektorů se přitom nazývá jejich lineární obal. Jinými slovy tedy chceme, aby lineární obal námi vybraných vektorů byl roven celému vektorovému prostoru. Dále ale ještě požadujeme, aby tyto vektory byly lineárně nezávislé. Dospíváme tak k obecné definici báze níže.
Definice
editovatBáze vektorového prostoru je taková množina vektorů z , která je lineárně nezávislá a jejíž lineární obal je roven celému prostoru . Prvky množiny pak nazýváme bazickými vektory nebo vektory báze. V symbolech lze definici přepsat jako
Tuto definici lze použít v případech, kdy má množina konečný, ale i nekonečný počet prvků. Pokud je počet jejích prvků nekonečný, tak je nutno mít na paměti, že lineární nezávislost takovéto množiny znamená, že každý konečný soubor vektorů vybraný z je lineárně nezávislý. Podobně, v definici lineárního obalu jsou vždy uvažovány jen lineární kombinace konečně mnoha vektorů z . Tímto způsobem je definována tzv. Hamelova báze, viz níže. Existují však zobecnění, viz Schauderova či ortonormální báze níže, kde jsou uvažovány "lineární kombinace nekonečně mnoha vektorů". Pokud se omezíme jen na konečnou množinu , lze výše uvedenou definici přepsat do podoby:
Báze vektorového prostoru je takový lineárně nezávislý soubor vektorů , pro který platí rovnost . Vektory pak nazýváme bazické vektory. V symbolech tedy
V právě uvedených formulacích nebyla požadována uspořádanost množiny či souboru vektorů, nezáleželo tedy na pořadí jejich prvků, a přesto jsme je nazývali bází. V některých případech je ale výhodné za bázi označovat množinu vektorů, v níž je pořadí těchto vektorů konkrétně zadané. Důležité to je např. pokud chceme sestrojit matici přechodu mezi dvěma bázemi. Pro různá uspořádání těchže vektorů pak dostáváme různé matice.
V definici výše není množina , popř. soubor vektorů , určena jednoznačně. V jednom vektorovém prostoru lze tedy nalézt více bází. Lze však dokázat, viz oddíl Vztah dimenze a báze níže, že všechny báze daného vektorového prostoru mají stejný počet prvků. Ač tedy můžeme za bázi zvolit obecně vícero souborů vektorů, dimenze daného vektorového prostoru je dána pevně.
Uvažujme nyní vektorový prostor (konečné dimenze ), jehož báze je . Z definice plyne, viz níže, že lze libovolný vektor z prostoru vyjádřit pomocí jednoznačně určených koeficientů ve tvaru
přičemž , kde je těleso, nad nímž je vektorový prostor definován. Obyčejně tedy nebo . Koeficientům , kde , pak říkáme souřadnice vektoru v bázi .
Jak bylo naznačeno v úvodu článku, pojem báze je úzce spojen s pojmem dimenze vektorového prostoru. Tu lze definovat buď nezávisle na definici báze, anebo druhým způsobem jako počet prvků libovolné báze daného vektorového prostoru, viz definice dimenze vektorového prostoru. Vyjděme nyní z prvního způsobu definice dimenze, který nám umožňuje definovat nekonečnou dimenzi prostoru, aniž bychom jakkoli specifikovali jeho bázi. Je vidět, že definice báze, která bere v úvahu jen konečné množiny , není schopna přiřadit bázi nekonečněrozměrnému vektorovému prostoru. Dosti často si s touto omezenější podobou definice vystačíme, její obecnější formulace výše pak v nekonečněrozměrném případě definuje tzv. Hamelovu bázi.
Kromě dvou právě uvedených formulací se objevují i další definice báze vektorového prostoru, jako Schauderova báze, ortonormální báze či trigonometrická báze, z nichž některé jsou rozebrány níže.
Generátory vektorového prostoru
editovatS pojmem báze vektorového prostoru souvisí pojem generátoru vektorového prostoru. Mějme vektorový prostor a dále jeho jistou neprázdnou podmnožinu . Pak říkáme, že množina generuje vektorový prostor , právě když lze každý vektor z prostoru vyjádřit jako lineární kombinaci vektorů z množiny . Prvky množiny pak nazýváme generátory vektorového prostoru .[pozn. 1] Jinými slovy, množina generuje vektorový prostor , právě když je jejím lineárním obalem. Neboli
Oproti bázi zde tedy nepožadujeme lineární nezávislost. Definici báze vektorového prostoru lze pak vyjádřit slovy:
- Mějme vektorový prostor . Pak každou množinu vektorů, která je lineárně nezávislá a generuje prostor , nazýváme báze vektorového prostoru .
Je-li vektorů v množině konečně mnoho, pak lze výše uvedenou definici generátorů přeformulovat takto: Mějme vektorový prostor a dále jeho jistou neprázdnou podmnožinu pro jisté přirozené číslo . Pak říkáme, že množina generuje vektorový prostor , právě když
Vektory pak nazýváme generátory vektorového prostoru . Definice generátorů vektorového prostoru se tak shoduje s definicí generátorů lineárního obalu.
Standardní báze
editovatV případě nejčastěji užívaných vektorových prostorů se definují jisté báze, který mají velmi jednoduchý tvar a s nimiž se snadno pracuje. Těmto bázím říkáme standardní báze. Nejedná se však o obecný pojem, standardní báze je ve svém konkrétním tvaru zavedena jen pro prostory aritmetických vektorů, posloupností (čísel), (číselných) matic a polynomů. Obecně by se místo číselných těles dala uvažovat tělesa libovolná. Tvary standardních bází pro právě uvedené prostory jsou vypsány v Příkladu 1 níže.
Hamelova báze
editovatZaměřme se nyní na definici báze podanou v úvodu sekce, kde za bereme i nekonečné množiny. Pokud použijeme tuto definici na konečněrozměrný prostor, tak nic nového nezískáme. Opět bychom dospěli ke konečné bázi, jejíž počet prvků by byl roven dimenzi vektorového prostoru. V případě nekonečněrozměrných vektorových prostorů se ale situace liší. Zde bychom bázi o konečně mnoha prvcích nenašli. Připustíme-li však platnost axiomu výběru, lze ukázat, že každý vektorový prostor, tedy i ten nekonečněrozměrný, má bázi (viz oddíl Existence báze níže). U nekonečněrozměrných prostorů této bázi říkáme Hamelova báze. Je pojmenována po německém matematikovi Georgu Hamelovi a občas se lze setkat i s nesprávným označením Hammelova báze. Připomeňme, že v definici lineárního obalu a lineárně nezávislé množiny vždy uvažujeme jen konečné lineární kombinace. V případě konečněrozměrných prostorů se Hamelova báze redukuje na běžnou bázi vektorového prostoru a je tedy přímým zobecněním báze konečněrozměrného vektorového prostoru na nekonečněrozměrný případ.
Jako příklad Hamelovy báze můžeme uvést standardní bázi prostoru posloupností či standardní bázi prostoru polynomů, viz Příklad 1.
Schauderova báze
editovatPři práci s nekonečněrozměrnými prostory není pojem Hamelovy báze dostačující. Definují se tak jiné báze. Máme-li vektorový prostor vybaven normou, který je navíc v dané normě úplný, můžeme jako nejpřímější zobecnění Hamelovy báze zavést Schauderovu bázi, která je pojmenována po svém tvůrci, polském matematikovi J. Schauderovi. Příkladem úplného vektorového prostoru s normou jsou Hilbertovy či obecněji Banachovy prostory. Občas se přízvisko v kontextu těchto prostorů vynechává a hovoří se pouze o bázi. Schauderova báze je v těchto prostorech definována následovně[1] [2]:
Nechť je Banachův prostor definovaný nad tělesem , označme si jeho normu jako . Pak posloupnost prvků z nazveme (Schauderovou) bází tohoto prostoru, jestliže pro každý vektor existuje právě jedna posloupnost prvků z tak, že platí
Rovnost výše je přitom chápána ve smyslu
Schauderova báze je oproti té Hamelově tedy obecnější v tom, že uvažuje i lineární kombinace "nekonečně" mnoha prvků. Není to však už báze vektorového prostoru (v algebraicekém smyslu). Můžeme říci, že zatímco je Hamelova báze množina, jejíž lineární obal je roven celému vektorovému prostoru, tak Schauderova báze je množina, pro niž uzávěr jejího lineárního obalu je roven celému Banachovu prostoru. V případě konečněrozměrných prostorů se pojem Schauderovy báze redukuje na běžnou definici báze vektorového prostoru.
Ortogonální báze, ortonormální báze
editovatDůležitou roli v prostorech se skalárním součinem, tedy např. v Hilbertových prostorech, hrají báze ortonormální, resp. ortogonální. Na prostorech konečné dimenze je ortogonální báze speciálním případem klasické báze, jejíž prvky navíc splňují vlastnost, že jsou na sebe kolmé. Ortogonální báze konečněrozměrného prostoru se skalárním součinem je tedy množina , která generuje celý prostor a pro jejíž prvky platí
kde závorka značí skalární součin v daném prostoru a . Ortogonalita vektorů totiž už zajišťuje jejich lineární nezávislost. Častěji užívaná je ale ortonormální báze, která má oproti ortogonální bázi ještě ten požadavek, že mají všechny její prvky jednotkovou velikost. Jinými slovy, ortonormální báze je množina generující celý prostor, pro jejíž prvky platí
kde závorka opět značí skalární součin v daném prostoru, značí Kroneckerovo delta a .
V prostorech nekonečněrozměrných se pak ortogonální báze definuje jako ortogonální množina, která je v daném Hilbertově prostoru totální. Podobně, ortonormální báze je taková podmnožina nekonečněrozměrného Hilbertova prostoru, která je ortonormální a totální v tomto prostoru. [3] Ortogonální množina je přitom taková množina nenulových vektorů z Hilbertova prostoru, jejíž každé dva prvky jsou ortogonální. Ortonormální množina je pak taková ortogonální množina, jejíž každý prvek má jednotkovou velikost, tj. pro každý její prvek platí . To, že je nějaká množina totální ve své nadmnožině, znamená, že uzávěr jejího lineárního obalu je roven této nadmnožině. Neboli, ortonormální báze Hilbertova prostoru je ortonormální podmnožina z taková, že , kde pruh nad označením množiny symbolizuje její uzávěr.
Z vlastností ortonormálních bází lze odvodit velmi užitečné vztahy, jako např. Parsevalovu rovnost, Besselovu nerovnost či rozklad vektoru za pomoci Fourierových koeficientů.
Vlastnosti
editovatVztah dimenze a báze
editovatOmezme se v tomto oddíle jen na konečněrozměrné vektorové prostory. Jak bylo předesláno výše, ač lze za bázi volit různé soubory vektorů, počet prvků báze je vždy tentýž, jak vyplývá z následujícího tvrzení.
- Každé dvě různé báze daného vektorového prostoru mají stejný počet prvků.
- Důkaz: Mějme dvě báze a téhož vektorového prostoru. Bez újmy na obecnosti nechť . Protože je báze, lze s její pomocí vyjádřit všechny vektory , které tak leží v lineárním obalu . Použijeme-li nyní Steinitzovy věty o výměně, dospíváme ihned ke sporu.
Na dalších třech tvrzeních si nyní ukažme vztah báze konečněrozměrného vektorového prostoru a jeho dimenze. Předpokládáme přitom, že dimenze vektorového prostoru byla definována nezávisle na jeho bázi, jak je to podáno v oddíle Definice článku Dimenze vektorového prostoru. Dohromady by šla trojice následujících tvrzení shrnout slovy: Každý vektorový prostor konečné dimenze má počet bazických vektorů roven své dimenzi.
- Nechť je . Pak ve existuje n-členná báze.
- Důkaz: Z předpokladů ve existuje n-členný lineárně nezávislý soubor vektorů . Aby tento soubor splňoval definiční podmínky báze, musíme ještě ukázat, že lze libovolný vektor z prostoru vyjádřit jako jistou lineární kombinaci tohoto souboru. Předpokládejme, že existuje vektor , který takto vyjádřit nelze. Pak ale z definice lineární nezávislosti plyne, že (n+1)-členný soubor je lineárně nezávislý. To je ale ve sporu s definicí dimenze, která říká, že každý (n+1)-členný soubor je lineárně závislý.
- Nechť a nechť ve existuje n-členná báze. Potom .
- Důkaz: Báze je soubor lineárně nezávislých vektorů generujících vektorový prostor, označme si ji jako . Z definice dimenze tedy plyne, že , neboť n je počet prvků báze. Zároveň ale z definice báze a Steinitzovy věty o výměně také vyplývá, že každý (n+1)-členný soubor vektorů je nutně lineárně závislý. Z definice dimenze tedy dále a celkově pak .
- Nulový vektorový prostor, tj. , nemá bázi.
- Důkaz: Nulový vektorový prostor obsahuje jen nulový vektor a každý soubor obsahující jen nulový vektor je lineárně závislý, viz první tvrzení v oddílu Ostatní článku Lineární nezávislost. Není tak splněn jeden z definičních požadavků báze.
Konstrukce báze
editovatOpět se omezme na případy konečněrozměrných vektorových prostorů. V případě nekonečné dimenze je situace složitější.
- Z každého souboru generátorů daného vektorového prostoru lze vybrat jeho bázi. Přesněji: Nechť je nenulový vektorový prostor tvaru pro jisté vektory , kde značí lineární obal. Potom a v případě existují navzájem různé indexy takové, že je báze .
- Důkaz: Buď jsou vektory lineárně nezávislé, a v tom případě tvoří bázi, anebo jsou lineárně závislé. V takovém případě lze z jejich souboru vyjmout jeden vektor, aniž bychom změnili jejich lineární obal, viz druhé tvrzení v oddílu Ostatní článku Lineární obal. Takto vzniklý soubor vektorů buď už je lineárně nezávislý, anebo z něj můžeme opět vyjmout jeden vektor, aniž bychom změnili lineární obal souboru. Takto můžeme pokračovat dál. Určitě se pak zastavíme přinejhorším na souboru obsahujícím jediný nenulový vektor. Nenulový proto, že předpokládáme nenulový vektorový prostor. Jeden proto, že soubor obsahující jediný nenulový vektor je vždy lineárně nezávislý. Vztah lze dokázat přímo z definice dimenze vektorového prostoru, nebo viz tvrzení o dimenzi lineárního obalu v oddíle Vektorové podprostory článku Dimenze vektorového prostoru. Dokázali jsme tak tvrzení věty.
- Každý lineárně nezávislý soubor ve vektorovém prostoru lze doplnit na jeho bázi. Přesněji: Nechť je lineárně nezávislý soubor vektorů z vektorového prostoru a nechť . Pak existují vektory tak, že soubor je báze prostoru .
- Důkaz: Protože , najdeme ve bázi . Jejím lineárním obalem je celý prostor , platí tak , tj. lineární obal vektorů je podprostorem lineárního obalu vektorů . Tvrzení věty pak ihned dostáváme užitím Steinitzovy věty o výměně.
- V konečnědimenzionálním prostoru dimenze n je bází každá množina obsahující n lineárně nezávislých vektorů.
- Důkaz: Mějme n lineárně nezávislých vektorů v prostoru dimenze n. Chceme ukázat, že generují celý vektorový prostor. Kdyby to nebyla pravda, tak by existoval vektor , který by nešlo vyjádřit jako lineární kombinaci těchto vektorů. Neboli soubor by byl lineárně nezávislý. Máme tedy lineárně nezávislý soubor délky n+1 v prostoru dimenze n, což je ve sporu s definicí dimenze. S použitím tvrzení dokázaných výše též můžeme říci, že v prostoru dimenze n existuje n-členná báze. Předchozí tvrzení nám navíc říká, že každý lineárně nezávislý soubor lze doplnit na bázi. Dostáváme tak rovnou tvrzení věty.
Závislost na tělese
editovatUkažme si na příkladu konečněrozměrných vektorových prostorů rozdíly v hodnotě jejich dimenze, chápeme-li daný vektorový prostor jako množinu definovanou nad rozdílnými tělesy. Přesněji řečeno, vektorový prostor je uspořádaná čtveřice . Pokud ponecháme množinu a změníme množinu , můžeme dostat vektorový prostor odlišné dimenze. Jiná hodnota dimenze se odrazí i na tvaru báze takového vektorového prostoru. Konkrétně si dokažme následující tvrzení.
- Nechť je komplexní vektorový prostor o dimenzi , nechť dále je jeho báze. Potom soubor délky 2n je báze prostoru , tj. . Symbol zde přitom značí imaginární jednotku a označuje množinu coby vektorový prostor nad tělesem reálných čísel.
- Důkaz: Libovolný vektor z lze zapsat ve tvaru , kde . Tento vztah lze přepsat do podoby . Pokud nyní za těleso bereme jen reálná čísla, stávají se vektory lineárně nezávislými na vektorech , protože imaginární jednotka už není součástí tělesa a výraz tak už nelze chápat jako násobek vektoru . Soubor je tedy lineárně nezávislý a ze vzorce výše i generuje celý prostor. Je to tedy báze prostoru a dimenze tohoto prostoru je tedy 2n.
Pro jednoduchou ilustraci tohoto jevu viz Příklad 4 níže.
Existence báze
editovatDokažme si v tomto oddíle důležité tvrzení: Každý nenulový vektorový prostor má bázi. Pro konečněrozměrné prostory jsme tuto větu už v podstatě dokázali v oddíle Vztah dimenze a báze. Bude nás tedy hlavně zajímat případ nekonečněrozměrných vektorových prostorů. Poznamenejme ještě, že nulový vektorový prostor, , žádnou bázi nemá. K důkazu věty budeme potřebovat axiom výběru, konkrétně jeho formulaci ve tvaru Zornova lemmatu.
Uvažujme nenulový vektorový prostor a systém všech jeho lineárně nezávislých podmnožin . Neboť množiny obsahující jediný nenulový vektor jsou lineárně nezávislé, je neprázdný. Díky relaci inkluze je tento systém navíc částečně uspořádaná množina. Máme-li dvě lineárně nezávislé množiny , ze systému , tak můžeme totiž definovat , právě když . Uvažujme nyní lineárně uspořádaný podsystém z . Sjednotíme-li všechny prvky podsystému , dostaneme množinu , o níž není těžké dokázat, že je jednak prvkem systému , jednak že je navíc nadmnožinou všech prvků podsystému . Množina je tedy horní závorou podsystému . Dokázali jsme tak, že každý lineárně uspořádaný podsystém systému je shora omezený. Aplikujeme-li Zornovo lemma, okamžitě dostáváme, že systém musí mít maximální prvek, označme si ho . O tomto maximálním prvku se nyní budeme snažit dokázat, že je bází vektorového prostoru . Protože leží v , tak musí být lineárně nezávislá, navíc je to určitě podmnožina prostoru . Zbývá tedy ukázat, že generuje . Kdyby tomu tak nebylo, tak najdeme vektor z tak, že ho nelze vyjádřit jako lineární kombinaci prvků z . Množina by tak byla lineárně nezávislá. Tato množina tedy patří do a přitom je větší (podle relace definované pomocí inkluze výše) než množina . To je ale spor s tím, že je maximální prvek v . Dokázali jsme tak, že každý nenulový vektorový prostor má bázi.
Jednoznačnost vyjádření
editovatDokažme si v tomto oddíle jednoduchý, avšak důležitý, důsledek definice báze. A sice, že rozklad libovolného vektoru konečněrozměrného prostoru do vektorů báze je jednoznačný. (Nyní v definici báze předpokládáme, že báze je navíc uspořádaný soubor vektorů.) Neboli
- Nechť je vektorový prostor konečné dimenze definovaný nad tělesem . Dále nechť je jeho báze. Pak pro libovolný vektor existuje právě jedna uspořádaná n-tice prvků z tělesa taková, že platí
- Důkaz: Existence nějaké n-tice prvků z tělesa splňující rovnost výše je zajištěna z definice báze. Je tedy nutné jen ověřit její jednoznačnost. Pro spor tedy předpokládejme existenci ještě jiné n-tice prvků , splňující tentýž vztah. Platí tedy . Neboli . Protože je ale soubor lineárně nezávislý, musí být všechny koeficienty rovny nule. To jest pro všechna , což je spor s předpokladem.
Souřadnicová zobrazení
editovatSouřadnicový izomorfizmus
editovatJak jsme viděli v oddíle Jednoznačnost vyjádření, tak pro každý vektor konečněrozměrného vektorového prostoru s danou n-člennou bází existuje právě jedna n-tice prvků z tělesa , jeho souřadnice. Máme tak definováno zobrazení z vektorového prostoru do množiny , které každému vektoru z přiřadí jeho souřadnice v dané bázi. Toto zobrazení se nazývá souřadnicový izomorfizmus (přidružený k dané bázi), označme si ho jako . Platí tedy, že , a explicitně vyjádřeno
Izomorfizmus je v kontextu lineární algebry přitom lineární bijektivní zobrazení. Měli bychom tedy nejdříve ověřit, že dané zobrazení tyto vlastnosti skutečně splňuje. Pro libovolné vektory
zjevně platí, že jejich součet má souřadnice rovné součtům souřadnic a podobně jejich násobek má souřadnice rovné násobku souřadnic. Neboli
kde . Platí tedy vztahy a a můžeme tak uzavřít, že je lineární zobrazení. Je též snadné nahlédnout, že pro každou n-tici prvků z najdeme vektor z , jehož souřadnice jsou rovny právě této n-tici. Navíc je tento vektor zřejmě určen jednoznačně. Zobrazení je tak prosté a na a my jsme dokázali, že se jedná o izomorfizmus.
Souřadnicový funkcionál
editovatPokud nás zajímá jen souřadnice odpovídající jednomu konkrétnímu bazickému vektoru, můžeme si definovat zobrazení, které vektoru přiřazuje právě jen tuto souřadnici. Řekněme, že ve vektorovém prostoru konečné dimenze definovaném nad tělesem máme bázi a zajímá nás nyní j-tá souřadnice vektorů z ve zmíněné bázi, kde . Pak lze definovat zobrazení , které každému vektoru přiřadí jeho j-tou souřadnici. Tomuto zobrazení se říká (j-tý) souřadnicový funkcionál v bázi . Platí tedy
Funkcionál je obecně zobrazení zobrazující z vektorového prostoru do jeho tělesa. Naprosto analogicky případu pro souřadnicový izomorfizmus bychom ukázali, že souřadnicový funkcionál je lineární zobrazení. Platí i pěkný vztah
kde je j-tý souřadnicový funkcionál pro bázi , vektor je k-tý bazický vektor a je Kroneckerovo delta. Tento vztah plyne ihned z definice souřadnicového funkcionálu, uvědomíme-li si, že platí .
Souřadnicové funkcionály mají i tu vlastnost, že tvoří bázi duálního prostoru k vektorovému prostoru . Každý vektor z lze totiž psát ve tvaru
Máme-li nyní libovolný lineární funkcionál z duálního prostoru , tak jeho působení na libovolný vektor můžeme vyjádřit ve tvaru
Nezajímá-li nás nyní konkrétní vektor , ale tvar samotného zobrazení, tak můžeme shrnout
Výrazy jsou totiž nyní prvky z tělesa a máme tak funkcionál vyjádřen jako lineární kombinaci souřadnicových funkcionálů. Lineární funkcionály tedy generují duální prostor. Dokažme si ještě jejich lineární nezávislost. Za tím účelem uvažujme jejich obecnou lineární kombinaci dávající nulový vektor, nulový funkcionál
Na pravé straně rovnosti je zobrazení, které každému vektoru přiřadí nulový prvek z tělesa. Abychom dokázali lineární nezávislost souboru lineárních funkcionálů, musíme ukázat, že každý koeficient je nulový. To ale není těžké dokázat, pokud do vztahu výše dosadíme bazické vektory. Pro j-tý bazický vektor je pravá strana nulová, zatímco na levé straně dostaneme
Vidíme tak, že koeficient je nulový. Stejně bychom postupovali i pro zbylé koeficienty. Dokázali jsme tak lineární nezávislost a můžeme shrnout, že soubor lineárních funkcionálů je bází duálního prostoru k prostoru .
Přechod mezi bázemi
editovatJak již bylo zmíněno, v nenulovém vektorovém prostoru lze nalézt více bází. V nenulových komplexních vektorových prostorech konečné dimenze je těchto bází dokonce nekonečně mnoho. Vždy totiž můžu libovolný vektor báze vynásobit nějakým nenulovým číslem. Lineární nezávislost ani schopnost souboru generovat prostor to nezmění, dostávám tak jinou, lehce odlišnou bázi. Protože je čísel nekonečně mnoho, mohu takto obdržet nekonečně mnoho bází. Pro práci s vektory se hodí různé báze v závislosti na úloze, je tedy velmi užitečné najít jednoduchý způsob, jak vektory vyjádřené souřadnicemi v jedné bázi vyjádřit pomocí souřadnic v bázi druhé. Za tímto účelem se zavádí matice přechodu mezi bázemi. Pokud si souřadnice daného vektoru narovnáme do sloupce, tak souřadnice téhož vektoru v nové bázi získáme tak, že tento sloupec zleva vynásobíme maticí přechodu.
Matice přechodu – úvod
editovatUkažme si nejprve, jak se k matici přechodu dospěje a pak si uveďme formální definici. Pro konkrétnost nechť a jsou dvě různé báze prostoru . Vektory jedné báze tak lze vyjádřit jako lineární kombinace vektorů druhé báze jako
Máme-li tedy libovolný vektor z prostoru , lze tento napsat jednak v bázi ve tvaru , jednak v bázi ve tvaru . Platí tedy, že
Protože je vyjádření vektoru v libovolné bázi jednoznačné, viz oddíl Jednoznačnost vyjádření, musí se rovnat koeficienty v posledních dvou výrazech a dostáváme tak
Tento vztah lze zapsat maticově ve tvaru
kde , a je tzv. matice přechodu, jejíž prvky jsou .
Matice přechodu – definice
editovatUveďme si nyní definici matice přechodu. Nechť je vektorový prostor konečné dimenze definovaný nad tělesem . Nechť a jsou dvě různé báze tohoto prostoru. Pak matice přechodu od báze k bázi je matice z splňující
kde jsou souřadnicové funkcionály přidružené k bázi . V matici přechodu je tedy v i-tém řádku a j-tém sloupci i-tá souřadnice bazického vektoru , když ho popisujeme v bázi . Alternativně můžeme matici přechodu od báze X k bázi Y definovat jako matici zobrazení pro izomorfizmus, která je vyjádřena v bázích X a Y.
Mějme nyní vektor z vektorového prostoru výše. Nechť jsou jeho souřadnice v bázi a jsou jeho souřadnice v bázi . Pak platí
Dokažme si nyní tento vztah. Důkaz bude v podstatě totožný s postupem, který jsme použili v předchozím oddíle. Víme, že platí . Protože stále pracujeme s tímtéž vektorovým prostorem, můžeme si vektory báze , jako kterékoli jiné vektory, vyjádřit v bázi . Pro tyto vektory pak platí vztahy
kde výraz je poněkud komplikovanější způsob zápisu j-té souřadnice vektoru v bázi . Když tento vztah dosadíme do vyjádření vektoru , dostáváme
Protože jsou indexy i a j sčítací, můžeme je bez následků přejmenovat. Přejmenujme tedy index i v sumě, která se nachází úplně vpravo ve výrazu výše, na k. Navíc přejmenujme ve stejném výrazu index j na i. Výraz za posledním rovnítkem výše tedy přejde do tvaru
Při pohledu zpět na předchozí rovnosti vidíme, že tento poslední výraz je roven vektoru a tedy i platí rovnost
odkud je hned vidět, že . Tento vztah ale není nic jiného, než definice násobení i-tého řádku matice s prvky sloupcovým vektorem se složkami . Dokázali jsme tak vztah pro převod souřadnic vektoru z jedné báze do druhé.
Jednoduchý příklad na sestrojení matice přechodu pro vektorový prostor dimenze tři lze nalézt v oddíle Příklad 3 – Matice přechodu níže.
Příklady
editovatPříklad 1 – Standardní báze
editovatJak bylo výše v oddíle Standardní báze uvedeno, vypišme si tvary standardních bází pro různé vektorové prostory.
Aritmetické vektory
editovatV prostoru aritmetických vektorů, tj. uspořádaných n-tic čísel, se za standardní bázi označuje množina tvaru
Není těžké ukázat, že tato množina skutečně tvoří bázi. Například v prostoru uspořádaných trojic čísel je možné každý vektor rozepsat způsobem
Lineární nezávislost by šla ověřit stejným způsobem. Místo trojic jsme samozřejmě mohli vzít libovolný rozměr n-tic.
Posloupnosti
editovatPřímým zobecněním standardní báze prostorů uspořádaných n-tic čísel je standardní báze prostoru číselných posloupností, která je tvořena posloupnostmi tvaru
V kompaktnějším tvaru pak lze libovolnou posloupnost ze standardní báze zapsat jako
kde symbol označuje Kroneckerovo delta.
Matice
editovatPodobně jako pro aritmetické vektory je možné definovat standardní bázi i pro matice (čísel), tj. , kde . Například prostor má standardní bázi tvořenou vektory
Analogicky bychom obdrželi standardní báze i pro matice jiných rozměrů.
Polynomy
editovatV prostoru polynomů se za standardní bázi označuje množina funkcí tvaru
kde symbol 1 je nutno chápat jako funkci, která nezávisle proměnné přiřadí jedničku. Pokud uvažujeme vektorový prostor polynomů stupně nejvýše n-1, pak je standardní báze takovéhoto prostoru rovna množině
Tento prostor má dimenzi n a označuje se obvykle jako .
Příklad 2 – Aritmetické vektory
editovatV předchozím příkladě jsme ukázali jeden z příkladů báze aritmetických vektorových prostorů. V každém nenulovém (komplexním) vektorovém prostoru (konečné dimenze) ale můžeme zavést bází nekonečně mnoho. Mějme příklad vektorového prostoru . Jednou z jeho bází je i množina tvořená vektory
Tato báze je dokonce ortogonální, když v prostoru uvažujeme skalární součin Pokud všechny tři vektory znormalizujeme, tj. vydělíme jejich (Euklidovou) normou, tak dostáváme jednu z možných ortonormálních bází prostoru tvaru
Příklad 3 – Matice přechodu
editovatUvažujme vektorový prostor z předchozího příkladu, jeho standardní bázi, kterou si označíme , a jeho ortonormální bázi z předchozího příkladu, kterou si označíme jako . Sestrojíme nyní matici přechodu z jedné báze do druhé. Uvažujme proto obecný vektor , který má ve standardní bázi souřadnice . Platí tedy
Zároveň ale chceme vektor nakombinovat z vektorů druhé báze, tj. chceme najít koeficienty takové, aby platilo
Jsme-li trochu zběhlí v násobení matice sloupcovým vektorem, můžeme si hned všimnout, že lze poslední výraz přepsat do tvaru
kde sloupcový vektor vpravo představuje souřadnice vektoru v bázi . Spočetli jsme tak, že matice přechodu od báze k bázi je rovna
Pokud nejsme tak zběhlí v násobení matic, můžeme při hledání matice přechodu vyjít z její definice. Vyjádříme si tedy vektory z báze pomocí vektorů z báze . Dostaneme
kde jsme jako označili vektory báze a jako jsme označili vektory báze . Platí tedy následující vztahy, kde označuje i-tou souřadnici vektoru v bázi
Když tyto hodnoty uspořádáme do matice dle definice, obdržíme matici přechodu vyobrazenou výše. (Pozor na indexy řádků a sloupců.)
Příklad 4 – Závislost na tělese
editovatPodobně jako v příkladu 2 článku Dimenze vektorového prostoru si nyní ilustrujme závislost báze vektorového prostoru na zvoleném tělese, jak je diskutováno výše v oddíle Závislost na tělese. Berme nejprve množinu komplexních čísel jako vektorový prostor nad tělesem komplexních čísel. V takovém případě je zjevně dimenze tohoto prostoru rovna jedničce a za jeho bázi si můžu vzít libovolné nenulové komplexní číslo. Pokud však chápeme tutéž množinu vektorů jako vektorový prostor nad tělesem reálných čísel, tak dimenze tohoto prostoru je a situace začíná být lehce komplikovanější. Obecné komplexní číslo totiž můžeme zapisovat ve tvaru , kde a jsou reálná čísla. Z tohoto pohledu tedy lze komplexní čísla chápat jako uspořádané dvojice reálných čísel. Za bazické vektory vektorového prostoru nad tělesem pak můžeme vzít například číslo 1 a imaginární jednotku i. V jazyce uspořádaných dvojic by tato volba odpovídala dvojici vektorů (1,0) a (0,1). Nyní už totiž číslo i není součástí tělesa (reálných čísel) a kvůli němu nám dimenze vzrostla z jedničky na dvojku.
Příklad 5 – L2
editovatKrom obyčejných bází ve vektorových prostorech můžeme brát v úvahu i báze ortonormální. Tyto báze přitom mohou v nekonečněrozměrných prostorech nabývat poněkud komplikovaných forem. Jako příklad nekonečněrozměrného Hilbertova prostoru uvažujme Hilbertův prostor kvadraticky integrabilních funkcí definovaných na intervalu . Lze ukázat, že množina funkcí tvaru[3]
kde index probíhá množinu celých čísel , je ortonormální báze tohoto prostoru. Této bázi se říká trigonometrická báze prostoru .
Jako další příklad si uveďme Hilbertův prostor kvadraticky integrabilních funkcí definovaných na intervalu (-1,1). O něm lze zase ukázat, že jedna z jeho ortonormálních bází je množina tvořená funkcemi tvaru[3]
jsou Legendrovy polynomy a kde .
Odkazy
editovatPoznámky
editovat- ↑ Poznámka k angličtině: Generátory (angl. generators) generují (angl. generate nebo span) vektorový prostor.
Reference
editovat- ↑ FUČÍK, Svatopluk; FUFNER, Alois. O Schauderových bázích a jejich aplikacích. S. 11–21. Pokroky matematiky, fyziky a astronomie [online]. 1974 [cit. 2014]. Roč. 19, čís. 1, s. 11–21. Dostupné online. ISSN 0032-2423.
- ↑ http://www.karlin.mff.cuni.cz/~zeleny/mff/MA2B/MA2b_Kap_18_tisk.pdf
- ↑ a b c BLANK, Jiří; EXNER, Pavel; HAVLÍČEK, Miloslav. Lineární operátory v kvantové fyzice. Praha: Karolinum, 1993. ISBN 80-7066-586-6.
Literatura
editovat- PYTLÍČEK, Jiří. Lineární algebra a geometrie. Praha: Česká technika - nakladatelství ČVUT, 2008. ISBN 978-80-01-04063-8. – skripta FJFI ČVUT
- BALKOVÁ, Ľubomíra. Lineární algebra 1. Praha: Česká technika - nakladatelství ČVUT, 2013. ISBN 978-80-01-05346-1. – skripta FJFI ČVUT
- BLANK, Jiří; EXNER, Pavel; HAVLÍČEK, Miloslav. Lineární operátory v kvantové fyzice. Praha: Karolinum, 1993. ISBN 80-7066-586-6.
Související články
editovatExterní odkazy
editovat- Obrázky, zvuky či videa k tématu báze na Wikimedia Commons