Προσομοιώσεις Φυσικής


Γνώσεις Θεωρίας Πιθανοτήτων & Στατιστικής I

2014-01-08 13:31
Οι καταιγιστικές εξελίξεις των τελευταίων ημερών με τα πειράματα του CERN και οι ακόμη μεγαλύτερες που αναμένεται να έρθουν επιβάλλουν να κάνουμε μια γρήγορη επανάληψη των εννοιών της θεωρίας πιθανοτήτων και της στατιστικής ώστε να μπορούμε να διαβάζουμε άνετα τα papers από πλευράς επεξεργασίας των δεδομένων και του στατιστικού ελέγχου υποθέσεων που κάνουν,που είναι και αυτό που τελικά κρίνει την μη ορθότητα της θεωρίας ή την αδυναμία απόρριψής της,γιατί ένα από αυτά
είναι πάντα το τελικό συμπέρασμα και ποτέ η σίγουρη ορθότητα.Για το σκοπό αυτό θα γράψω μια σειρά από posts όπου θα υπενθυμίσω,συνοπτικά,όλες αυτές τις έννοιες ξεκινώντας από την θεμελίωση της θεωρίας πιθανοτήτων και φθάνοντας μέχρι τη στατιστική ,τη θεωρία δειγματοληψίας και τους ελέγχους υποθέσεων η κατανόηση των οποίων είναι βασική για να διαβάζουμε τα papers των αποτελεσμάτων των πειραμάτων.Ξεκινώ λοιπόν εδώ με την θεμελίωση της θεωρίας πιθανοτήτων.



Θεμελίωση της θεωρίας πιθανοτήτων

Σε ένα πείραμα τύχης υπάρχει αβεβαιότητα για το αν θα συμβεί ένα ορισμένο γεγονός.Η αβεβαιότητα αυτή μπορεί να είναι απλά αδυναμία πρόβλεψης του αποτελέσματος μολονότι είναι απολύτως ντετερμινιστική η φυσική θεωρία που περιγράφει τους νόμους πού καθορίζουν την εξέλιξη,π.χ. η ρίψη ενός νομίσματος,ή μπορεί,όπως ξέρουμε από τις σύγχρονες θεωρίες,η αβεβαιότητα να είναι θεμελιώδης,λ.χ. στα φαινόμενα της κβαντομηχανικής,της Κβαντικής Φυσικής γενικότερα.Ασχέτως της προέλευσης αυτής της αβεβαιότητας,μπορούμε να την διαχειριστούμε με ένα μέτρο της πιθανότητας να συμβεί ένα ορισμένο γεγονός.Ένα τέτοιο μέτρο της πιθανότητας θα μπορούσε να είναι ένας αριθμός μεταξύ 0 και 1 όπου το 1 αντιστοιχεί στην βεβαιότητα της πραγματοποίησης τους γεγονότος αυτού ενώ το 0 στην βεβαιότητα της μη πραγματοποίησής του.
Σε ένα πείραμα τύχης το σύνολο \Omega όλων των δυνατών αποτελεσμάτων ονομάζεται δειγματοχώρος του πειράματος τύχης.Κάθε δυνατό αποτέλεσμα είναι ένα σημείο αυτού του δειγματοχώρου.Ένα υποσύνολο A του \Omega ονομάζεται γεγονός.Αν το αποτέλεσμα ενός πειράματος τύχης είναι ένα στοιχείο που ανήκει στο υποσύνολο A τότε λέμε πως πραγματοποιήθηκε το γεγονός.Ένα γεγονός που περιλαμβάνει ένα μόνο στοιχείο του \Omega λέγεται στοιχειώδες γεγονός.Κάνοντας πράξεις με γεγονότα του \Omega μπορούμε να πάρουμε άλλα γεγονότα του \Omega:

1) A\vee B \rightarrow τουλάχιστον ένα από τα A και B

2)A\wedge B \rightarrow A και B

3)\sim A \rightarrow όχι A

Επίσης αν A \wedge B=\varnothing τότε τα γεγονότα A και B λέγονται ασυμβίβαστα.

Τώρα,πώς θα μπορούσε να οριστεί η πιθανότητα;Υπάρχουν οι λεγόμενοι κλασικοί ορισμοί:

A priori ορισμός:Το πείραμα τύχης μπορεί να δώσει n διαφορετικά και εξ'ίσου πιθανά αποτελέσματα εκ των οποίων h είναι ευνοικά δηλαδή αν συμβούν θεωρούμε πως έχει συντελεστεί το γεγονός.Τότε η πιθανότητα του γεγονότος είναι \frac{h}{n}

A posteriori ορισμός:Μετά από n επαναλήψεις του πειράματος τύχης με n πολύ μεγάλο, ένα γεγονός παρατηρείται ότι έχει συμβεί h φορές.Τότε η πιθανότητα (που εδώ λέγεται και εμπειρική πιθανότητα) του εν λόγω γεγονότος είναι \frac{h}{n}

Οι φράσεις με την κόκκινη και bold γραμματοσειρά στους παραπάνω ορισμούς είναι ακριβώς και η μεγάλη αδυναμία τους.Το "εξ'ίσου πιθανά" και το "n πολύ μεγάλο" είναι έννοιες ασαφείς.Γι'αυτό το λόγο έχει προτιμηθεί η αποφυγή της αναφοράς στο πείραμα τύχης και η αξιωματική θεμελίωση μιας θεωρίας των πιθανοτήτων ως εξής:

Έχουμε το δειγματοχώρο \Omega.Αν ο \Omega είναι διακριτός όλα τα υποσύνολά του αντιστοιχούν σε γεγονότα και αντιστρόφως, ενώ αν είναι συνεχής μόνο τα μετρήσιμα υποσύνολά του αντιστοιχούν σε γεγονότα.Σε κάθε γεγονός A της κλάσης C των γεγονότων αντιστοιχούμε ένα πραγματικό αριθμό P(A)P είναι λοιπόν μια πραγματική συνάρτηση επί του C και λέγεται συνάρτηση πιθανότητας και η τιμή P(A) καλείται πιθανότητα του γεγονότος A αν ικανοποιεί τα παρακάτω αξιώματα:

1) Για κάθε γεγονός A της κλάσης C είναι P(A)\geq 0

2) Για το βέβαιο γεγονός \Omega της κλάσης C είναι P(\Omega)=1

3) Αν τα γεγονότα A_1,A_2,\ldots,A_n της κλάσης C είναι ανα δύο ασυμβίβαστα τότε:

\displaystyle P(A_1 \vee A_2\vee\cdots)=P(A_1)+P(A_2)+\ldots

Πιθανότητα υπό συνθήκη

Έστω δύο γεγονότα A και B με P(A)>0.P(B|A) είναι η πιθανότητα να συμβεί το B με την προϋπόθεση ότι έχει συμβεί το A.Αυτή η πιθανότητα είναι:

\displaystyle P(B|A)=\frac{P(A\wedge B)}{P(A)}

Αν P(B|A)=P(B) τότε η πιθανότητα του B δεν επηρεάζεται από την πιθανότητα του A και τα A και B λέγονται ανεξάρτητα γεγονότα.Δηλαδή:

\displaystyle P(A\wedge B)=P(A) P(B)

Ένα σημαντικό θεώρημα της θεωρίας πιθανοτήτων είναι το θεώρημα Bayes:
Έστω ότι η ένωση των ασυμβίβαστων γεγονότων A_1,A_2,\ldots,A_n είναι ο δειγματοχώρος \Omega.Δηλαδή ένα μόνο από αυτά τα γεγονότα θα πραγματοποιηθεί.Τότε αν A είναι ένα οποιοδήποτε γεγονός του \Omega ισχύει:

\displaystyle P(A_k|A)=\frac{P(A_k)P(A|A_k)}{\sum_{k=1}^n P(A_k)P(A|A_k)}

Υπάρχουν και άλλοι τρόποι αξιωματικής θεμελίωσης της θεωρίας πιθανοτήτων.Ένας από αυτούς είναι:

1) \displaystyle 0\leq P(A|B)\leq 1
2) \displaystyle P(A|A)=1
3) \displaystyle P(\sim A|B)=1-P(A|B)
4)\displaystyle P(A\wedge B|C)=P(A|C)P(B|A\wedge C)

Τι είναι η πιθανότητα;

Η αφηρημένη θεωρία πιθανοτήτων που περιλαμβάνει αξιώματα,ορισμούς και θεωρήματα πρέπει να εφοδιαστεί και με μια ερμηνεία της έννοιας της πιθανότητας που θα είναι και ένας κανόνας αντιστοίχησης μεταξύ της αφηρημένης θεωρίας και των πρακτικών εφαρμογών και προβλημάτων.Υπάρχουν διάφορες ερμηνείες,επειδή κάθε τι που ικανοποιεί τα αξιώματα μπορεί να ιδωθεί ως πιθανότητα.
Ο a priori ορισμός της πιθανότητας είναι και μια ερμηνεία,η ερμηνεία της οριακής συχνότητας.Ότι αν μια συνθήκη C μπορεί να οδηγήσει είτε στο A είτε στο \sim A και αν σε n επαναλήψεις αυτής της κατάστασης το γεγονός A συμβαίνει m φορές,τότε:

\displaystyle P(A|C)=\lim_{n \to \infty}\frac{m}{n}

Το πρόβλημα όμως είναι πως αυτή η ερμηνεία είναι ταυτόχρονα και ορισμός και ως τέτοιος έχει τα προβλήματα που περιγράψαμε πριν.Δηλαδή την ασάφεια του "n πολύ μεγάλο" που εδώ μεταφράζεται ως αδυναμία γνώσης του αν αυτό το όριο υπάρχει για κάθε ακολουθία γεγονότων.
Μια ερμηνεία της έννοιας της πιθανότητας που απαλλάσσει από αυτό το πρόβλημα είναι η propensity interpretation.Η πιθανότητα P(A|C) ερμηνεύεται εδώ ως μέτρο της τάσης μιας φυσικής συνθήκης C να δημιουργεί το γεγονός A.Το λογικό αυτό σχήμα διαφέρει ως εννοιολογική κατασκευή από την προηγούμενη ερμηνεία/ορισμό ακριβώς ως προς το ότι η πιθανότητα ερμηνεύεται αλλά δεν επανορίζεται όπως προηγουμένως.Δηλαδή τα αξιώματα της θεωρίας (1-4) είναι τα θεμελιώδη και δεν παράγονται ως θεωρήματα από κάτι θεμελιωδέστερο όπως ο a priori ορισμός με τις εγγενείς ασάφειες που έχει.
Επίσης διαφέρει στο ότι αντιμετωπίζει την πιθανότητα σαν ένα χαρακτηριστικό της φυσικής συνθήκης C που διέπει μια ακολουθία γεγονότων και όχι ως μια απλή ιδιότητα (συχνότητα \frac{m}{n}) μιας ακολουθίας γεγονότων.Και αυτό υπενθυμίζεται συνεχώς γράφοντας πάντα την πιθανότητα ως P(A|C) και όχι ως P(A).Αυτή είναι και η ερμηνεία της πιθανότητας που χρησιμοποιείται στην θεωρητική Φυσική,δηλαδή στην Κβαντική Φυσική και στην Στατιστική Φυσική.
Μια άλλη ερμηνεία είναι αυτή της inductive inference.Εδώ τα γεγονότα αντικαθίστανται εννοιολογικά από προτάσεις που μπορούν να είναι είτε αληθείς είτε ψευδείς (true,false) και η πιθανότητα P(\alpha|\gamma) ερμηνεύεται ως βαθμός λογικής πίστης στο \alpha δοθέντος ότι το \gamma είναι αληθές.Θα μπορούσαμε να μιλήσουμε,στο πλαίσιο αυτού του ερμηνευτικού σχήματος,για την πιθανότητα η τιμή του στοιχειώδους ηλεκτρικού φορτίου να κυμαίνεται μεταξύ 1,60\times 10^{-19} coulomb και 1,61\times 10^{-19} coulomb,δοθέντων κάποιων πειραματικών δεδομένων.Και ακριβώς αυτή η ερμηνεία είναι ικανοποιητική για ελέγχους υποθέσεων για παραμέτρους που εξάγονται από δεδομένα που προέρχονται από κάποιο πείραμα,δηλαδή στην Πειραματική Φυσική.
Από τη στιγμή που κάθε ερμηνεία που δεν επανορίζει την πιθανότητα,ικανοποιεί τα αξιώματα της θεωρητικής θεμελίωσης,μπορεί να χρησιμοποιηθεί για το σκοπό που τη θέλουμε.Δεν δημιουργούν,δηλαδή,λογικές ασυνέπειες,οι διαφορετικές ερμηνείες για διαφορετικούς σκοπούς,από τη στιγμή που απλά ερμηνεύουν και δεν επανορίζουν δηλαδή δεν θέτουν αξίωση θεμελιωδέστερη από τα αξιώματα.Aντιθέτως η κατάλληλη κάθε φορά ερμηνεία διευκολύνει τη μελέτη συγκεκριμένων θεμάτων.

—————

Πίσω