Alla cortese attenzione del Forum.
Oggetto: dubbio nella dimostrazione del teorema di struttura delle applicazioni lineari
(rif. Lezione 16 a.a. 2013/2014 e/o Lezione 17 a.a. 2014/2015)
Quesito:
Nella dimostrazione del teorema di struttura dobbiamo dimostrazione due cose:
1) che esiste una applicazione lineare tra due spazi vettoriali V e W (e questo significa dimostrare sia l'esistenza e sia la linearità)
2) che questa applicazione lineare sia unica
Riguardo al punto 1) si esprime un qualunque altro vettore V di v come combinazione lineare della base scelta in V. E fin qui nessun problema.
Il problema sorge nel passaggio successivo perchè di fatto si applica la definizione di linearità alla funzione f. In altri termini, per dare legittimità al passaggio (somma delle f e costanti portate fuori) si sta dicendo che la f è una applicazione lineare, cosa che dobbiamo dimostrare!!
E dobbiamo dimostrare non solo la linearità, ma anche l'esistenza!!.
Si cerca di fornire risposta a questo problema nella "verifica della linearità". Ma anche qui ritorniamo al problema di partenza perchè:
1) anzitutto si sta dicendo che esiste (e non lo sappiamo!)
2) si riapplica nuovamente la definizione di applicazione lineare (somma delle f e costanti portate fuori) cosa che non saremmo autorizzati a fare non avendo dimostrato che la f (oltre ad esistere) è anche lineare.
Dimostrazione teorema di struttura delle applicazioni lineari
-
- Nuovo utente
- Posts: 1
- Joined: Tuesday 21 July 2009, 18:14
- Massimo Gobbino
- Amministratore del Sito
- Posts: 2535
- Joined: Monday 29 November 2004, 19:00
- Location: Pisa
- Contact:
Re: Dimostrazione teorema di struttura delle applicazioni lineari
No no no, calma calma.
Chiariamo bene la situazione. Abbiamo n vettori \(v_1,\ldots,v_n\) che sono una base dello spazio V (ed è essenziale che siano una base), e altri n vettori \(w_1,\ldots,w_n\) in uno spazio W eventualmente diverso (questi ultimi non devono necessariamente essere una base, né essere linearmente indipendenti). Il nostro obiettivo è dimostrare che esiste almeno una applicazione lineare \(f:V\to W\) tale che \(f(v_i)=w_i\) per ogni indice i che va da 1 ad n. Poi dopo aver dimostrato l'esistenza potremo porci eventualmente il problema dell'unicità.
Per il momento f è stata definita solo sugli n vettori dati, e non sul resto. Si tratta ora di estenderla al resto di V. Come facciamo? Prendiamo un qualunque vettore v di V e lo scriviamo come combinazione lineare degli elementi della base
\(v=c_1v_1+\cdots+c_nv_n\)
Qui è essenziale avere a che fare con gli elementi della base, il che ci assicura che la scrittura di sopra esiste ed è unica. Una volta che abbiamo scritto v come sopra, poniamo
\(f(v)=c_1f(v_1)+\cdots+c_nf(v_n)\)
Qui non stiamo facendo nessuna cosa losca. Non stiamo usando la linearità di f, perché f non è ancora stata definita se non negli n elementi inizialmente dati. Semplicemente ci stiamo avvalendo del nostro diritto di definire f come ci pare sul resto di V. Volendo avremmo potuto anche definirla in maniera molto più buffa, solo che chi semina vento raccoglie tempesta. Infatti, dopo averla definita (in questo od in altro modo), dobbiamo fare 2 verifiche.
\(f(x+y)=f(x)+f(y)\)
per ogni x e y in V. Seguiamo la procedura che ci siamo dati. Scriviamo x e y come
\(x=a_1v_1+\cdots a_nv_n\qquad\) e \(\qquad y=b_1v_1+\cdots b_nv_n\)
Allora dalla definizione data sopra segue che
\(f(x)=a_1f(v_1)+\cdots a_nf(v_n)\qquad\) e \(\qquad f(y)=b_1f(v_1)+\cdots b_nf(v_n)\)
Allora sommando e riarrangiando i termini (si noti che qui si usano un po' di proprietà che compaiono nella definizione di spazio vettoriale) otteniamo
\(f(x)+f(y)=(a_1+b_1)f(v_1)+\cdots (a_n+b_n)f(v_n)\qquad\)
Ora dobbiamo dimostrare che questa cosa è uguale a f(x+y). Ma quanto vale f(x+y)? Per saperlo, data la nostra definizione, devo scrivere x+y come combinazione lineare degli elementi della base. Come si scrive x+y come combinazione lineare degli elementi della base? Ovviamente come
\(x+y=(a_1+b_1)v_1+\cdots (a_n+b_n)v_n\qquad\)
Questo è così ovvio? Come si dimostra? Data questa scrittura, sappiamo scrivere f(x+y), e guarda caso viene proprio quello che ci aspettavamo. Si noti che qui non abbiamo usato la linearità di f, ma l'abbiamo ottenuta come conseguenza della definizione che abbiamo posto.
Chiariamo bene la situazione. Abbiamo n vettori \(v_1,\ldots,v_n\) che sono una base dello spazio V (ed è essenziale che siano una base), e altri n vettori \(w_1,\ldots,w_n\) in uno spazio W eventualmente diverso (questi ultimi non devono necessariamente essere una base, né essere linearmente indipendenti). Il nostro obiettivo è dimostrare che esiste almeno una applicazione lineare \(f:V\to W\) tale che \(f(v_i)=w_i\) per ogni indice i che va da 1 ad n. Poi dopo aver dimostrato l'esistenza potremo porci eventualmente il problema dell'unicità.
Per il momento f è stata definita solo sugli n vettori dati, e non sul resto. Si tratta ora di estenderla al resto di V. Come facciamo? Prendiamo un qualunque vettore v di V e lo scriviamo come combinazione lineare degli elementi della base
\(v=c_1v_1+\cdots+c_nv_n\)
Qui è essenziale avere a che fare con gli elementi della base, il che ci assicura che la scrittura di sopra esiste ed è unica. Una volta che abbiamo scritto v come sopra, poniamo
\(f(v)=c_1f(v_1)+\cdots+c_nf(v_n)\)
Qui non stiamo facendo nessuna cosa losca. Non stiamo usando la linearità di f, perché f non è ancora stata definita se non negli n elementi inizialmente dati. Semplicemente ci stiamo avvalendo del nostro diritto di definire f come ci pare sul resto di V. Volendo avremmo potuto anche definirla in maniera molto più buffa, solo che chi semina vento raccoglie tempesta. Infatti, dopo averla definita (in questo od in altro modo), dobbiamo fare 2 verifiche.
- Che la nuova definizione sia compatibile con la vecchia (cioè che sia ancora vero che \(f(v_i)=w_i\), anche ora che abbiamo usato questa nuova procedura che passa per le componenti di un vettore).
- Che la f che abbiamo definito sia lineare, cioè mandi somme in somme e gli scalari escano fuori.
\(f(x+y)=f(x)+f(y)\)
per ogni x e y in V. Seguiamo la procedura che ci siamo dati. Scriviamo x e y come
\(x=a_1v_1+\cdots a_nv_n\qquad\) e \(\qquad y=b_1v_1+\cdots b_nv_n\)
Allora dalla definizione data sopra segue che
\(f(x)=a_1f(v_1)+\cdots a_nf(v_n)\qquad\) e \(\qquad f(y)=b_1f(v_1)+\cdots b_nf(v_n)\)
Allora sommando e riarrangiando i termini (si noti che qui si usano un po' di proprietà che compaiono nella definizione di spazio vettoriale) otteniamo
\(f(x)+f(y)=(a_1+b_1)f(v_1)+\cdots (a_n+b_n)f(v_n)\qquad\)
Ora dobbiamo dimostrare che questa cosa è uguale a f(x+y). Ma quanto vale f(x+y)? Per saperlo, data la nostra definizione, devo scrivere x+y come combinazione lineare degli elementi della base. Come si scrive x+y come combinazione lineare degli elementi della base? Ovviamente come
\(x+y=(a_1+b_1)v_1+\cdots (a_n+b_n)v_n\qquad\)
Questo è così ovvio? Come si dimostra? Data questa scrittura, sappiamo scrivere f(x+y), e guarda caso viene proprio quello che ci aspettavamo. Si noti che qui non abbiamo usato la linearità di f, ma l'abbiamo ottenuta come conseguenza della definizione che abbiamo posto.