Questa non vuole essere una guida
sulle funzioni di excel,ma semplicemente una dimostrazione di
utilizzo del programma e della sua potenza di calcolo.In questo
tutorial vedremo la capacità di excel di effettuare calcoli
statistici da quelli più semplici a quelli più complessi.Per chi ha
studiato statistica sa che esistono le caratteristiche e le
modalità,e cosa sia il concetto di popolazione statistica,comunque
lo ripetiamo.In statistica si usa studiare i fenomeni
collettivi,cioè un insieme di manifestazioni individuali.In pratica
per fare un esempio di fenomeno collettivo possiamo pensare allo
studio del consuno di reddito di 100 famiglie di una regione.Bene,il
consumo di reddito noi lo chiameremo"carattere"e possiamo indicarlo
con X,mentre le 100 famiglie sono ognuna una unità statistica
elementare,ed insieme formano il collettivo statistico detto appunto
popolazione statistica.Il nostro carattere dovrà manifestarsi in un
certo modo,cioè diciamo che dovrà assumere delle modalità,queste le
possiamo chiamare m1,m2,m3......mk,cioè emme kappesime modalità,in
statistica possiamo scrivere m per i=1......k.Siccome stiamo
parlando di consumo di reddito non possiamo che pensare a
cifre,quindi numeri,allora si dice che il carattere X è
numerico,mentre non può essere così per esempio per il carattere
X(sesso)che può assumere come modalità solo maschio o femmina,quindi
si dice qualitativo.Ogni modalità di un carattere si può presentare
nel nostro studio un certo numero di volte,questo numero di volte lo
chiamiamo frequenza assoluta e la indichiamo con Ni.Le modalità e le
frequenze di un carattere possiamo rappresentarle in forma tabellare,per
esempio rappresentiamo in tabella una distribuzione di frequenze
semplice del consumo di reddito di 10 persone in un anno,allora il
consumo sarà la nostra X mentre le modalità rappresentano la
quantità consumata.Adesso creiamo una tabella in word e la
importiamo in excel.
Adesso vogliamo rappresentare la frequenza di osservazione di ogni
modalità,per esempio costruiamo una tabella dove rappresentiamo la
frequenza con cui si presenta un importo.
Come potete vedere l'importo maggiore di 10.000.000 si presenta 8
volte fra le modalità e così via per gli altri.Possiamo fare in modo
che sia excel a contare in base a delle condizioni,abbiamo due
modi,usare la funzione Cont oppure utilizzare un filtro automatico
oppure condizionale.Iniziamo a riprodurre la prima tabella ma questa
volta nel foglio elettronico.Rappresentiamo nella colonna di
sinistra le modalità mentre a destra dovremo far calcolare le
frequenze.
Adesso abbiamo solo una distibuzione di modalità,ora facciamo come
nella seconda tabella,cioè calcoliamo le frequenze in base alle
modalità,useremo excel e precisamente sfrutteremo la funzionalità
dei database.In excel quando inseriamo una serie di valori in riga
ed abbiamo la prima riga in grassetto stiamo in effetti creando un
database,come nel nostro caso.Excel ci permette di lavorare sui
database e di poter confrontare una serie di valori.Adesso dobbiamo
selezionare la prima riga quella in grassetto e ricopiarla uguale in
una zona vuota esterna al database,possibilemente non sotto,anzi
selezioniamo solo la prima voce della riga cioè Consumi e la copiamo
dove vogliamo,mettiamola ad esempio nella cella J6.Adesso cancellate
la parola frequenze e sostituitela con "importi",sempre in grassetto.Adesso
sotto a Importi scrivete questi valori a
scendere(>10000000,10000000,>20000000,20000000).Adesso accanto alla
voce Importi scrivete Frequenze sempre in grassetto,ora la parola
frequenze ricopiatela in un punto qualsiasi, ci servirà come base di
calcolo,mettiamola in F7.Adesso scrivete sotto alla parola comsumi
nella cella j6 la voce >10000000.Ora dobbiamo far capire a excel che
deve trovare fra gli importi quelli >10000000 e dobbiamo
trascriverne il conteggio sotto alla parola frequenze che abbiamo
ricopiato in F7.Quindi spostiamoci sotto alla cella F7 poi
clicchiamo su incolla funzione
.Scegliamo le funzioni statistiche e precisamente la funzione db.contanumeri
Ora dovete selezionare la colonna che sarà usata da excel per fare i
calcoli,selezionate l'intervallo A7:A17,mentre per la voce campo
dovete scegliere la cella che contiene la parola consumi,infine
sotto dovete scegliere la cella j6 e quella di sotto,dovreste avere
come risultato 8.Ora facciamo il conteggio per gli altri valori che
si trovano nella colonna Importi,vi basta cancellare il valore nella
cella frequenze,quella del risultato,modificare il valore sotto alla
cella consumi e dovete fare le stesse scelte di prima,avrete ogni
volta un risultato diverso,ed ogni volta prendete il risultato e
copiatelo nella colonna frequenze,vi guiderò almeno nel secondo
risultato, copiamo il risultato 8 della cella f8 nella cella accanto
a >10000000 cioè in C8,poi dobbiamo cancellare il valore 8 in f8 e
quello che abbiamo nella cella j7.Ora scriviamo in j7 10000000,poi
dovete fare tutto come prima,dovreste avere come risultato
2,continuate fino alla fine, dovrebbero essere in tutto 4 calcoli.Un
suggerimento vi avevo detto di cancellare ogni volta il valore
trovato in frequenza,ma non serve basta cancellare quello in j7,
modificarlo,e vedrete cambiare il risultato nella cella f8,poi
potete trascriverlo nella colonna delle frequenze,dovreste avere
questa tabella

Abbiamo appena creato in excel quella che in statistica si chiama
distribuzione di frequenza semplice.Adesso invece dobbiamo calcolare
le frequenze cumulative che vengono utilizzate per caratteri che
presentano modalità sudduvise in classi.
Le frequenze cumulative si calcolano attraverso la formula Ni/n cioè
dobbiamo dividere quelle assolute per il numero delle unità
statistiche.Per sapere le unità statistiche dobbiamo sommare le
frequenze assolute,ci basta utilizzare la sommatoria di excel,allora
posizioniamoci sotto l'ultima cella della colonna frequenze,e
clicchiamo sull'icona a forma di sommatoria ed avremo il totale che
è 21.Adesso accanto alla colonna delle frequenze assolute creiamo
quella delle frequenze cumulative,diamogli il nome di "cum"sempre in
grassetto.Adesso andiamo nella cella vuota sotto a Cum ed inseriamo
la formula =b6/b10 ed avremo la prima frequenza cumulativa,facciamo
lo stesso per le altre.Ora proviamo ad arrotondare meglio i
risultati,manteniamo solo tre cifre decimali,per farlo selezioniamo
tutti i risultati ottenuti ed andiamo nel menu formato poi su celle
ed infine scegliamo numero,in posizione decimale scegliamo
tre,provate a fare la sommatoria ed avrete 1.Adesso calcoliamo le
frequenze assolute cumulate,cioè dobbiamo sommare la frequenza della
nostra classe a quella della classe precedente.Allora la prima sarà
uguale cioè 5,mentre la seconda sarà pari alla seconda frequenza
assoluta sommata a quella precedente,cioè 8.Scriviamo accanto alla
parola frequenze cum,la parola freq.ass.cum,poi sotto scriviamo 5 e
sotto inseriamo questa formula =b7+b6,poi sotto facciamo b8+b7,poi
b9+b8 e così via
In statistica i dati oltre ad essere rilevati vengono anche
rappresentati graficamente,in genere si usano gli istogrammi a base
regolare,clicchiamo allora sull'icona a forma di grafico,poi
scegliamo istogramma e clicchiamo su avanti.Adesso cliccate sempre
sulla solita icona che si trova adesso accanto al campo "intervallo
dati"poi selezionate le celle che contengono i dati,senza 21 e
1,cioè i totali,e dovete scegliere serie in colonne,andate avanti.In
titolo del grafico scrivete consumo reddito,andate avanti e
scegliete poi la posizione del grafico e scegliete fine.Il grafico
potete spostarlo dove volete.

Supponiamo di voler sapere quale è il voto medio ottenuto da 5
studenti universitari all'esame di statistica.Dobbiamo indicare in
una tabella 5 studenti con 5 voti poi dobbiamo calcolare la media
aritmetica.Nella cella A1 scrivete studente in grassetto,mentre a
lato scrivete voti sempre in grassetto.Ora sotto a studente scrivete
1,2,3,4,5 mentre in voto 20,21,22,23,24.Adesso sotto all'ultimo voto
scriviamo media in grassetto,poi nella cella a lato scegliamo
incolla funzione,e nelle statistiche scegliamo media,nel campo num1
scegliamo l'intervallo di voti,adesso 24 cambiatelo in 23,
calcoliamo quella che in statistica viene chiamata moda,cioè la
modalità che si presenta il più grande numero di volte.Sotto alla
parola media scrivete moda e nella cella accanto scegliete incolla
funzione e da quelle statistiche scegliete moda.Ora dovete
selezionare tutti i voti e vedrete che vi da 23.Supponiamo di voler
sapere di quanto si è incrementato in media il voto agli esami di
uno studente universitario.Consideriamo sempre la tabella di
prima,dobbiamo calcolare quella che si chiama media geometrica.Scriviamo
sotto alla parola moda la parola media geo,e nella cella accanto
scegliamo come funzione media geometrica,poi selezionate i voti ed
avrete il risultato.Adesso vogliamo calcolare le media delle
deviazioni dei valori dalla loro media in valore assoluto,cioè
sommatoria*/voto1-media aritmetica/.../n,dove volete inserire la
formula dovete scegliere come funzione ,media dev e selezionare
sempre i voti.In statistica possiamo stabilire anche quale è il
valore che divide una distribuzione in 2 parti uguali,cioè la
mediana.Dove volete che sia calcolata scegliete dalle funzioni la
voce mediana e selezionate la colonna dello studente,dovreste avere
3.Mentre la media troncata è la media aritmetica però calcolata
togliendo un certo numero di valori a sinistra e a destra,ad esempio
allarghiamo un pò la ditribuziuone dei voti ed aggiungiamo 24,28.Quindi
avremo 8 valori,adesso se vogliamo calcolare la media al 30% cioè
0,30 equivale a troncare a sinistra e a destra un numero di unità
pari a 0.30*n,dove n è il numero di voti che sono 8 nell'esempio,il
risultato si ottiene con un formula complessa,ma comunque ci viene
incontro excel che contiene già la formula,quindi scegliamo media
troncata dalle funzioni ed avremo il risultato.Adesso calcoliamo
invece la dipendenza di un carattere da un altro
carattere,supponiamo di avere due caratteri,il carattere X(materia
d'esame)ed il carattere Y(voto),vogliamo calcolare i ranghi per i
due caratteri.Il rango è la posizione occupata da una unità dopo
aver riordinato i dati.Scrivete una tabella come segue
Adesso andiamo nella prima cella vuota del rango x cioè D5 poi
clicchiamo sulla icona di incolla funzione,scegliamo poi rango in
quelle statistiche.Adesso avrete come primo campo in cui scegliere"num",dovete
selezionare la cella di cui deve trovare la posizione,nel nostro
caso sarebbe B5 che contiene 10.Sotto invece dovete selezionare
l'intervallo di dati,cioè tutti i valori sotto la X,però dovete
usare l'accortezza di far precedere i riferimenti di riga e colonna
dal simbolo $,cioè nel nostro caso sarebbe $B$5:$B$14,sotto infine
inserite qulunque numero diverso da zero,mettete 1.Avrete come
risultato 1.Adesso andate sulla cella che contiene il risultato cioè
D5,scegliete copia e selezionate tutte le cella da D6 fino D14 e
scegliete incolla,vedrete effettuare il risultato per tutte le altre
celle.In statistica possiamo anche studiare l'asimmetria di una
distribuzione,una distribuzione di valori si dice asimmetrica se le
frequenze dei valori inrorno alla media non si presentano con una
certa simmetria.Per calcolare l'asimmetria esistono degli indici,ma
possiamo affidarci ad excel.Per calcolare l'asimmetria dobbiamo
vedere se media=moda=mediana,solo così sarà simmetrica la
distribuzione.In A2 scrivete X,poi sotto scrivete i seguenti
valori(10,20,30,40,50,60).Sotto a 60 scrivete media,adesso nella
cella accanto a media,inserite la funzione "media" riferita
all'intervallo dei valori che abbiamo inserito.Ora sotto a media
scrivete moda,ed inserite accanto il calcolo della moda che abbiamo
visto in precedenza,e sotto a moda scrivete mediana,e calcolatela
accanto.Provate a cambiare il secondo numero in 10,i risultati che
avrete sono 33,3;10;35.Come vedete non sono uguali fra di loro
quindi sicuramente sarà asimettrica la distribuzione.In statistica
se abbiamo un valore per l'asimmetria che è negativo allora anche l'asimnmetria
sarò negativa cioè presenterà una coda a sinistra altrimenti si dirà
positiva.Allora provate a scrivere asimmetria in qualunque cella e
poi scegliete la funzione asimmetria e selezionate l'intervallo di
valori ed avrete un valore negativo.Possiamo anche studiare fra due
serie di valori se sono correlate,per esempio vogliamo vedere se una
malattia dipende dalla genetica,allora assumiamo la genetica come
carattere X e l'altro come Y,poi in qualunque cella scegliamo la
funzione correlazione ,dopo aver selezionato le due serie di valori
avremo il tipo di correlazione ,che quanto più si avvicina a 1 tanto
più sono correlate.
Nel nostro caso abbiamo avuto 0,60..come correlazione,quindi i due
caratteri sono molto correlati.