La probabilità, la scienza del caso, e la statistica, la scienza dell'interpretazione dei dati, sono due rami della matematica che influenzano e governano la nostra vita quotidiana. Vengono utilizzate per prevedere il tempo, determinare l'efficacia delle medicine e sono un processo importante per fare scoperte scientifiche.
Il rapporto tra probabilità e statistica
È importante comprendere le differenze e le analogie tra probabilità e statistica. Si tratta di materie diverse ma correlate.
La probabilità è una materia teorica utilizzata per analizzare la possibilità che delle situazioni si verifichino. La statistica, invece, è una materia applicata che utilizza la teoria della probabilità per analizzare dati raccolti.
La probabilità e la statistica sono collegate in quanto
- le teorie sviluppate nella matematica della probabilità vengono confrontate con i risultati statistici che possono fornirci ulteriori informazioni sui dati. Inoltre, molti teoremi e risultati della probabilità si traducono in un uso pratico in statistica, e garantiscono che la statistica sia efficace;
- le statistiche sono usate per stimare la probabilità che qualcosa accada in futuro.
Definizione di probabilità matematica
Intuitivamente, certe cose sono facili da prevedere, per esempio quanto è probabile che arrivi a scuola in orario se ti alzi troppo tardi!
Ma non per tutti gli eventi si può conoscere a priori la probabilità. Pensa a quanto sia probabile che il tuo migliore amico faccia il compleanno lo stesso giorno di te, o chi vinca una partita, o che la scuola diventi interamente virtuale tra qualche anno.
Chi per scopri di lucro (per esempio per commercializzare un prodotto), o per il proprio tornaconto (per esempio investire in borsa), chi per l’utilità sociale (per esempio determinare il meteo), tutti in qualche modo usiamo la probabilità. Ma per avere risultati accurati, bisogna anche usare gli strumenti giusti.
Figura 1. La probabilità viene usata per determinare il meteo.
La probabilità matematica studia la descrizione numerica della probabilità che un evento si verifichi. La probabilità riguarda situazioni della vita reale in cui è difficile prevedere se si verificheranno o meno perché i loro possibili esiti si verificano in modo casuale. Tuttavia, spesso si dispone di informazioni preziose che possono essere utilizzate per prevedere la probabilità che ciascun risultato si verifichi.
Termini della probabilità
La terminologia della probabilità è molto vasta, ma dare un nome ai vari concetti aiuta a esprimersi meglio. Quanto meglio si comprendono i concetti di base illustrati di seguito, tanto più facile sarà affrontare le domande di probabilità più difficili!
Esperimento o prova: Un'azione che si può ripetere e che ha un insieme definito di risultati.
Spazio campionario: L'insieme di tutti i possibili risultati o esiti di un esperimento, solitamente indicato con S.
Evento: Un evento è un singolo esito, solitamente indicato con una lettera maiuscola. La probabilità che si verifichi l'evento A è comunemente indicata come P(A).
L'evento contrario: \(\bar E\) di un evento \(E\), è quell'evento che ha come esito l'opposto dell'esito di \(E\), da cui anche il nome evento complementare \(E^c\), cioè quello che accade se non accade \(E\).
Due eventi si dicono indipendenti quando il verificarsi di un evento non influisce sulla probabilità che ne accada un altro.
Due eventi si dicono incompatibili se non possono verificarsi contemporaneamente.
La probabilità condizionata indica che la probabilità di un evento è influenzata da un altro evento che si è verificato.
Cerchiamo di capire meglio questi concetti tramite un esempio.
Se ti trovi in un gioco a premi (l’esperimento) e devi scegliere tra due scatole, una contenente uno smartphone, l’altra vuota, gli unici due esiti sono vincere (V) e perdere (P). Gli eventi saranno quindi V e P, e lo spazio campionario sarà S = {V, P} perché questi sono gli unici due risultati possibili.
Calcolo delle probabilità
Il calcolo delle probabilità assegna dei valori numerici alla probabilità che una situazione, o usando il termine proprio della probabilità, un evento si verifichi. La maniera più immediata di misurare una probabilità, è tramite una percentuale. Mai sentito dire: "Fifty fifty”? Pensa al lancio di una moneta per esempio: c'è una probabilità pari del 50% che esca testa e una probabilità del 50% che esca croce, avendo due sole possibilità. Sarà il caso a determinare quale dei due.
Figura 2. Lanciando una moneta la probabilità che esca testa è del 50%
Nel calcolo delle probabilità, piuttosto che usare la percentuale tra 0% (impossibile che capiti) e 100% (è sicuro che accadrà), si usano frazioni, o numeri decimali compresi tra \(0\) (zero) e \(1\).
La probabilità di non invecchiare è 0, perché impossibile.
La probabilità che il giorno dopo sabato prossimo sarà domenica è 1, perché certo.
Nell’esempio del gioco a premi, supponi che non ti venga dato alcun indizio su quale scatola contenga il premio e devi quindi scegliere una scatola a caso. Qual è la probabilità di vincere lo smartphone? Intuitivamente, poiché la scelta è casuale, c'è la stessa probabilità di scegliere il premio e di scegliere la scatola vuota. Dovendo indicare la probabilità con un numero compreso tra 0 e 1, quale numero si trova a metà? Giusto! La probabilità di scegliere lo smartphone è \( \frac{1}{2}=0,5 (= 50\%) \).
La formula di base della probabilità ci dice che la probabilità di un evento \(E\) si calcola come numero di modi affinché si ottenga l’esito E diviso il numero totale di esiti possibili. Potremmo scriverlo così:
\[P(E) = \frac{\text{numero di casi favorevoli}}{\text{numero di casi possibili}}\]
Nell’esercizio di prima, utilizzando questa formula, otterremo lo stesso risultato.
Il numero di modi per scegliere la scatola con lo smartphone è 1 e il numero totale di esiti (scegliere lo smartphone o la scatola vuota) è 2. Usando la notazione matematica, la probabilità di vincere è la seguente:
\[ P(V) = \frac{1}{2}\]
Formule di probabilità
Le principali regole di probabilità che è necessario tenere a mente quando si calcolano le probabilità sono:
- La probabilità che un evento si verifichi è compresa tra \(0\) (zero) e \(1\):
- La somma delle probabilità di tutti i risultati possibili è uguale a \(1\).
Proprietà | Descrizione | Formula |
Regola del complemento | La probabilità che un evento si verifichi è uguale a \(1\) meno la probabilità che l'evento non si verifichi | \[ P(E) = 1 - P(\bar{E})\] |
Somma logica di eventi | La probabilità che si verifichi \(A\) o \(B\) è uguale alla probabilità di \(A\) più la probabilità di \(B\) meno la probabilità che \(A\) e \(B\) si verifichino contemporaneamente | \[ P(A \cup B) = P(A)+P(B)-P(A \cap B)\] |
Somma logica di eventi incompatibili | Per calcolare la probabilità che \(A\) o \(B\) si verifichino in questo caso, utilizziamo la regola dell’addizione* | \[ P(A \cup B) = P(A)+P(B)\] |
Prodotto logico di eventi indipendenti | Se \(A\) e \(B\) sono indipendenti, la probabilità che \(A\) e \(B\) si verifichino contemporaneamente è uguale alla probabilità di \(A\) moltiplicata per la probabilità di \(B\) | \[ P(A \cap B) = P(A) \times P(B)\] |
Probabilità condizionata | La probabilità che accada \(B\), supponendo che sia accaduto \(A\), è uguale alla probabilità che \(A\) e \(B\) si verifichino contemporaneamente diviso la probabilità di \(A\) | \[ P(B|A) = \frac{P(A \cap B) }{P(A)}\] |
* La regola cambia perché per gli eventi incompatibili \(P(A \cap B)=0\).
Definizione di statistica
Ogni giorno grosse aziende e istituzioni conducono esperimenti, sondaggi, osservazioni o interviste, per raccogliere delle informazioni utili per l’azienda stessa o la comunità.
Di solito la quantità di dati raccolti è talmente grande che non siamo in grado di capirli nel loro insieme. È per questo che abbiamo bisogno della statistica: per aiutarci a comprendere meglio la complessità dei dati che abbiamo raccolto.
La statistica è il ramo della matematica che si occupa di organizzare, analizzare e interpretare i dati raccolti tramite osservazioni, sondaggi ed esperimenti, giungendo a conclusioni significative.
I dati di cui parliamo possono essere di due tipi: qualitativi o quantitativi. I dati qualitativi si riferiscono a dati descrittivi, come le parole. I dati quantitativi si riferiscono a cose che possono essere rappresentate con i numeri e misurate, come l'altezza o il peso.
I dati quantitativi si dividono in due categorie: continui e discreti.
I dati discreti devono assumere valori particolari all'interno di un intervallo, il che rende più facile il loro conteggio. Ad esempio, il numero di scarpe può essere 38 o 39, ma non 38,26735!
I dati continui possono assumere qualsiasi valore all'interno di un intervallo. Ad esempio, la lunghezza può essere misurata con il maggior numero di decimali possibile. Spetta a chi raccoglie i dati decidere quante cifre decimali sono necessarie.
In statistica sono di grande aiuto le tabelle, i grafici, e i diagrammi, che rappresentano i dati in maniera organizzata e metodologica. Ci permettono di visualizzare all’istante le conclusioni di un insieme di dati.
Fasi della ricerca statistica
I passi più importanti della statistica sono
- La raccolta dei dati
- L’analisi dei dati
- La rappresentazione e l’interpretazione dei dati
Raccolta dei dati
I metodi più usati sono:
- Il censimento in cui i dati vengono raccolti tramite l’osservazione o le risposte da ogni singolo membro di una popolazione.
- Il campionamento in cui i dati vengono raccolti da un sottoinsieme di una popolazione chiamato campione. Questo sottoinsieme è spesso scelto seguendo criteri specifici per rappresentare la popolazione nel modo migliore possibile.
- Gli esperimenti controllati in cui una procedura scientifica è pianificata in modo da poter raccogliere e analizzare dati accurati.
Un esperimento scientifico potrebbe essere misurare l'effetto della posizione sulla crescita delle piante.
Un censimento potrebbe essere l’osservazione e la registrazione del numero di studenti che arrivano in ritardo a lezione.
Un campionamento potrebbe essere la registrazione dei suggerimenti da parte degli studenti di una sola sezione di una scuola, riguardo la preferenza sulla meta della prossima visita guidata.
L’analisi dei dati
Una volta raccolti i dati, è ora di iniziare ad analizzarli. Poiché è molto difficile (e spesso impossibile!) capire i dati nella loro forma grezza, dobbiamo condensarli in descrizioni maneggevoli che conservino il maggior numero possibile di informazioni sui dati pur essendo comprensibili. Questo è l'obiettivo finale della statistica: comprendere, descrivere e trovare informazioni significative dagli insiemi di dati.
Esistono due modi per descrivere una statistica: indici di posizione e di dispersione.
Gli indici di posizione utilizzano riassumono un insieme di dati mediante un valore in qualche modo centrale. Essi comprendono:
- La media, una statistica particolarmente comune e utile che richiede la somma dei valori e la loro divisione per il numero di valori, spesso indicata con \( \bar x= \frac{\text{somma dei valori}}{\text{numero di valori}}\);
- La mediana, il valore intermedio in un elenco ordinato di valori;
- La moda, il valore più comune.
Gli indici di dispersione descrivono di quanto i dati siano lontani da un valore centrale scelto. Essi comprendono:
- L'intervallo di variazione, il valore più grande meno il valore più piccolo dei dati;
- Lo scarto interquartile che descrive l'intervallo dei "quartili" centrali dei dati, tra il 25% e il 75%, che circondano la mediana al 50%;
- La varianza ci dà un'idea di quanto siano lontani i dati dal valore medio;
- La deviazione standard può essere espressa come la radice quadrata della varianza.
Rappresentazione, visualizzazione e interpretazione dei dati statistici
I dati sono spesso rappresentati in tabelle di frequenza. La frequenza si riferisce al numero di volte in cui si verifica qualcosa, che nel caso delle statistiche sarà il numero di volte in cui si verifica un particolare valore per i dati. Da una tabella di frequenza è possibile estrarre statistiche descrittive come quelle sopra elencate. Potrete anche utilizzarle per visualizzare i dati.
Le statistiche descrittive sono utili per condensare i dati in una piccola quantità di informazioni e ci possono dire dove si trovano e come si diffondono i dati. Le visualizzazioni dei dati, invece, sono in grado di rappresentare graficamente i dati. Ogni grafico o diagramma ha le sue caratteristiche, ma tutti ci aiutano a trarre velocemente delle conclusioni.
Figura 3. Tre modi diversi per rappresentare dati statistici, areogramma, istogramma e grafico lineare
Per un'analisi approfondita, l'ideale sarebbe utilizzare entrambi i metodi per poter comprendere appieno il comportamento dei dati.
Troverai spiegazioni approfondite e tanti esempi in altri articoli di StudySmarter!
Probabilità e statistica - Key takeaways
- La probabilità matematica studia la descrizione numerica della probabilità che un evento si verifichi.
- Un evento è un singolo esito, solitamente indicato con una lettera maiuscola. La probabilità che si verifichi l'evento A è comunemente indicata come P(A).
- Due eventi si dicono indipendenti quando il verificarsi di un evento non influisce sulla probabilità che ne accada un altro.
- Due eventi si dicono incompatibili se non possono verificarsi contemporaneamente.
- La probabilità condizionata si verifica quando la probabilità di un evento è influenzata da un altro evento che si è verificato.
\[\text{la probabilità di un evento} E = \frac{\text{numero di modi affinché si ottenga l’esito E}}{\text{numero totale di esiti possibili}}\]
La statistica è il ramo della matematica che si occupa di organizzare, analizzare e interpretare i dati raccolti tramite osservazioni, sondaggi ed esperimenti, giungendo a conclusioni significative.
I dati qualitativi si riferiscono a dati descrittivi, come le parole. Possono essere raccolti attraverso interviste o sondaggi. I dati quantitativi si riferiscono a cose che possono essere rappresentate con i numeri e misurate, come l'altezza o il peso.
I passi più importanti della statistica sono
- La raccolta dei dati
- L’analisi dei dati
- La rappresentazione e l’interpretazione dei dati
- Gli indici di posizione più utilizzati sono
- La media
- La mediana
- La moda
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Get to know Lily
Content Quality Monitored by:
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
Get to know Gabriel