Ομοιόμορφη κατανομή (συνεχής)
Η ακρίβεια του λήμματος αμφισβητείται. |
Στην Θεωρία πιθανοτήτων και στη Στατιστική, η συνεχής, ομοιόμορφη κατανομή ή ορθογώνια κατανομή είναι οικογένεια συμμετρικών κατανομών πιθανοτήτων στην οποία, για κάθε μέλος της οικογένειας, όλα τα διαστήματα ίσου μήκους στην υποστήριξη της κατανομής είναι ισοπίθανα. Η υποστήριξη καθορίζεται από δύο παραμέτρους, a και b, που είναι η ελάχιστη και η μέγιστη τιμή της. Η κατανομή συχνά συμβολίζεται με U(a,b). Είναι η μέγιστη κατανομή πιθανότητας εντροπίας για μια μεταβλητή Χ χωρίς κανένα περιορισμό, παρ' όλο που αυτή δέχεται περιορισμό στην υποστήριξη της κατανομής[1].
Συμβολισμοί | or |
Παράμετροι | |
Υποστήριξη | |
Συνάρτηση πυκνότητας πιθανότητας | |
Συνάρτηση αθροιστικής κατανομής | |
Μέση τιμή | |
Διάμεσος | |
Συρμός | οποιαδήποτε τιμή στο |
Διακύμανση | |
Λοξότητα | 0 |
Κυρτότητα | |
Εντροπία | |
Ροπογεννήτρια | |
Χαρακτηριστική Συνάρτηση |
Χαρακτηρισμός
[Επεξεργασία | επεξεργασία κώδικα]Συνάρτηση πυκνότητας πιθανότητας
[Επεξεργασία | επεξεργασία κώδικα]Η συνάρτηση πυκνότητας πιθανότητας της συνεχούς ομοιόμορφης κατανομής είναι:
Οι τιμές της f(x) στα δύο άκρα a και b είναι συχνά ασήμαντες γιατί δεν μεταβάλλουν τις τιμές των ολοκληρωμάτων του f(x) dx σε οποιοδήποτε διάστημα, ούτε της x f(x) dx ή κάποια υψηλότερη ροπή. Μερικές φορές επιλέγεται να είναι μηδενικές, και μερικές φορές να είναι 1/(b − a). Το δεύτερο είναι κατάλληλο στο πλαίσιο της εκτίμησης με την μέθοδο της μέγιστης τύχης. Στο πλαίσιο της ανάλυσης Fourier, το ένα παίρνει την τιμή του f(a) ή f(b) για να γίνει 1/(2(b − a)), μέχρις ότου ο αντίστροφος μετασχηματισμός πολλών ολοκληρωτικών μετασχηματισμών της ομοιόμορφης συνάρτησης δώσει πίσω την ίδια τη συνάρτηση,παρά μια συνάρτηση που είναι ίση "σχεδόν παντού", δηλαδή, εκτός ενός συνόλου με μέτρο μηδέν. Επίσης, να είναι σύμφωνο με τη συνάρτηση προσήμου η οποία δεν έχει τέτοια ασάφεια.
Όσο αφορά τη μέση τιμή μ και τη διασπορά σ2, η πυκνότητα της πιθανότητας μπορεί να γραφεί ως εξής:
Συνάρτηση αθροιστικής κατανομής
[Επεξεργασία | επεξεργασία κώδικα]Η Συνάρτηση αθροιστικής κατανομής είναι:
Η αντίστροφή της είναι:
Στην σημειογραφία της μέσης τιμής και της διακύμανσης, η συνάρτηση αθροιστικής κατανομής είναι:
κι η αντίστροφη είναι:
Παράγουσες συναρτήσεις
[Επεξεργασία | επεξεργασία κώδικα]Ροπή-παράγουσας συνάρτησης
[Επεξεργασία | επεξεργασία κώδικα]Η ροπογεννήτρια συνάρτηση είναι[2]:
απο την οποία μπορούμε να υπολογίσουμε τις πρώτες ρωπές mk
- .
Για μια τυχαία μεταβλητή που ακολουθεί την κατανομή, η αναμενόμενη τιμή είναι m1 = (a + b)/2 και η διακύμανση είναι m2 − m12 = (b − a)2/12.
Αθροιστικός δείκτης- παράγουσας συνάρτησης
[Επεξεργασία | επεξεργασία κώδικα]Για n ≥ 2, ο n-οστός αθροιστικός δείκτης της ομοιόμορφης κατανομής στο διάστημα [-1/2, 1/2] είναι bn/n,όπου bn είναι ο n-οστός αριθμός Bernoulli[3].
Ιδιότητες
[Επεξεργασία | επεξεργασία κώδικα]Ροπές και Παράμετροι
[Επεξεργασία | επεξεργασία κώδικα]Η πρώτη ροπή της κατανομής είναι:
Η δεύτερη κεντρική ροπή (ή διακύμανση) είναι:
Λύνοντας τις δύο αυτές εξισώσεις για τις παραμέτρους a και b,με δεδομένες τις ροπές E(X) και V(X), έχουμε:
Διατεταγμένα στατιστικά στοιχεία
[Επεξεργασία | επεξεργασία κώδικα]Έστω X1, ..., Xn να είναι ένα δείγμα πολλών ανεξαρτήτων και ταυτόσημων κατανεμημένων τυχαίων μεταβλητών από το U(0,1). Έστω X(k) να είναι το κ-οστό διατεταγμένο στατιστικό στοιχείο του δείγματος. Τότε η κατανομή πιθανότητας του X(k) είναι μια κατανομή Beta με παραμέτρους k και n-k+1. Η προσδοκώμενη τιμή είναι:
Αυτή η περίπτωση είναι χρήσιμη όταν κάνουμε γραφικές παραστάσεις του Q-Q.
Οι διασπορές είναι:
Ομοιομορφία
[Επεξεργασία | επεξεργασία κώδικα]Η πιθανότητα μια ομοιόμορφα κατανεμημένη τυχαία μεταβλητή να εμπίπτει σε οποιoδήποτε διάστημα σταθερού μήκους είναι ανεξάρτητη του εντοπισμού του ίδιου του διαστήματος (αλλά εξαρτάται από το μέγεθός του), εφόσον το διάστημα περιέχεται στην υποστήριξη της διανομής.
Για να γίνει αντιληπτό, εάν X ~ U(a,b) και [x, x+d] είναι ένα υποδιάστημα του [a,b] με σταθερό d > 0, τότε:
το οποίο είναι ανεξάρτητο του x. Το γεγονός αυτό αποτελεί το κίνητρο για την ονομασία της κατανομής.
Γενίκευση του συνόλου Borel
[Επεξεργασία | επεξεργασία κώδικα]Αυτή η κατανομή μπορεί να γενικευτεί σε πιο περίπλοκα σύνολα από τα διαστήματα. Εάν S είναι ένα σύνολο Borel θετικού, πεπερασμένου μέτρου, η ομοιόμορφη κατανομή της πιθανότητας του S προσδιορίζεται καθορίζοντας το pdf (μερικές διαφορικές εξισώσεις ) να είναι μηδέν έξω από το S και συνεχώς ίσο με 1/K στο S, όπου το K είναι το μέτρο του Lebesgue στο S.
Κανονική ομοιόμορφία
[Επεξεργασία | επεξεργασία κώδικα]Περιορίζοντας το και το , η κατανομή U(0,1) που προκύπτει στο ονομάζεται κανονική ομοιόμορφη κατανομή.
Μια ενδιαφέρουσα ιδιότητα της κανονικής ομοιόμορφης κατανομής είναι ότι, αν το u1 παρουσιάζει κανονική ομοιόμορφη κατανομή, τότε το ίδιο συμβαίνει και για το 1-u1. Η ιδιοτητα αυτή μπορεί να χρησιμοποιηθεί, μεταξύ άλλων, και για γενικευμένες αντιθετικές τυχαίες μεταβλητές.
Σχετικές κατανομές
[Επεξεργασία | επεξεργασία κώδικα]- Αν X είναι μια κανονική ομοιόμορφη κατανομή ,τότε με την μέθοδο αντίστροφου μετασχηματισμού δειγματοληψίας, Y = − λ−1 ln(X) έχει εκθετική κατανομή με (τιμή) παράμετρο λ .
- Αν X είναι μια κανονική ομοιόμορφη κατανομή ,Y = Xn τότε είναι μια κατανομή beta με παραμέτρους 1/n και 1. (Σημειώνεται ότι αυτό συνεπάγεται πως η κανονική ομοιόμορφη κατανομή είναι ειδική περίπτωση της κατανομής beta, με παραμέτρους 1 και 1.)
- Η κατανομή Irwin–Hall είναι το άθροισμα των n ανεξαρτήτων και ταυτόσημων κατανεμημένων τυχαίων μεταβλητών (i.i.d) των U(0,1) κατανομών.
- Το άθροισμα δυο ανεξαρτήτων,ίσα κατανεμημένων, ομοιόμορφων κατανομών δίνει μια συμμετρική τριγωνική κατανομή.
- Η απόσταση μεταξύ δύο ανεξαρτήτων και ταυτόσημων κατανεμημένων ομοιόμορφα τυχαίων μεταβλητών (i.i.d) παρουσιάζει μια ομοιόμορφη τριγωνική κατανομή ,ωστόσο όχι συμμετρική.
- Η ομοιόμορφη κατανομή μπορεί να θεωρηθεί μια κατανομή beta με παραμέτρους (1,1).
Σχέση με άλλες συναρτήσεις
[Επεξεργασία | επεξεργασία κώδικα]Όσο οι ίδιες συμβάσεις ακολουθούνται από τα σημεία μετάβασης, η συνάρτηση πυκνότητας πιθανότητας της πιθανότητας μπορεί, επίσης, να εκφραστεί σε όρους της κλιμακωτής συνάρτησης του Heaviside:
ή σε όρους της ορθογώνιας συνάρτησης
Δεν υπάρχει ασάφεια στα σημεία μετάβασης της συνάρτησης προσήμου. Χρησιμοποιώντας το ήμισυ της μέγιστης σύμβασης στα σημεία μετάβασης, η ομοιόμορφη κατανομή μπορεί να εκφραστεί σε όρους της συνάτησης προσήμου ως εξής:
Εφαρμογές
[Επεξεργασία | επεξεργασία κώδικα]Η σημαντικότερη χρήση της ομοιόμορφης κατανομής βρίσκεται στις γεννήτριες τυχαίων αριθμών[4].
Στη Στατιστική ,όταν η τιμή-p χρησιμοποιείται ως δοκιμή σε στατιστικό τεστ σε κενή υπόθεση, και η κατανομή του τεστ είναι συνεχής, τότε η τιμή-p είναι ανομοιόμορφα κατανεμημένη μεταξύ του 0 και του 1 εάν η κενή υπόθεση είναι αληθής.
Δειγματοληψία απο ομοιόμορφη κατανομή
[Επεξεργασία | επεξεργασία κώδικα]Υπάρχουν πολλές εφαρμογές οι οποίες είναι χρήσιμες για την εκτέλεση πειραματικών προσομοιόσεων. Πολλές γλώσσες προγραμματισμού δίνουν την δυνατότητα παραγωγής ψευδο-τυχαίων αριθμών οι οποίοι παρουσιάζουν κανονική ομοιόμορφη κατανομή.
Εάν u είναι η τιμή μιας δειγματοληψίας απο μια κανονική ομοιόμορφη κατανομή, τότε η τιμή a + (b − a)u ακολουθεί την ομοιόμορφη κατανομή η οποία παραμετροποιείται απο τα a και b, όπως περιγράφηκε παραπάνω.
Δειγματοληψία από οποιαδήποτε κατανομή
[Επεξεργασία | επεξεργασία κώδικα]Η ομοιόμορφη κατανομή είναι χρήσιμη για τη δειγματοληψία από οποιαδήποτε κατανομή. Μία γενική μέθοδος είναι αυτή του αντίστροφου μετασχηματισμού, η οποία χρησιμοποιεί την συνάρτηση κατανομής (CDF) της επιθυμητής τυχαίας μεταβλητής. Η μέθοδος αυτή είναι πολύ χρήσιμη σε θεωρητικό επίπεδο. Επειδή οι προσομοιώσεις με τη χρήση αυτής της μεθόδου απαιτούν την αντιστροφή της συνάρτησης κατανομής της επιθυμητής, επινοήθηκαν εναλλακτικές μέθοδοι για τις περιπτώσεις όπου η CDF δεν είναι γνωστή σε κλειστή μορφή. Μία τέτοια μέθοδος είναι η δειγματοληψία απόρριψης.
Η κανονική κατανομή είναι σημαντική περίπτωση όπου η μέθοδος αντίστροφου μετασχηματισμού δεν είναι αποτελεσματική. Ωστόσο, υπάρχει συγκεκριμένη μέθοδος, ο μετασχηματισμός Box–Muller, που χρησιμοποιεί τον αντίστροφο μετασχηματισμό για να μετατρέψει δύο ανεξάρτητες ομοιόμορφες τυχαίες μεταβλητές σε δύο ανεξάρτητες κανονικά κατανεμημένες τυχαίες μεταβλητές.
Σφάλμα κβαντισμού
[Επεξεργασία | επεξεργασία κώδικα]Σε κάθε μετατροπή από αναλογικό σε ψηφιακό σήμα εισάγεται σφάλμα κβαντισμού. Αυτό το σφάλμα προέρχεται είτε από στρογγυλοποίηση είτε από περικοπή. Όταν το αρχικό σήμα είναι πολύ μεγαλύτερο από ένα λιγότερο σημαντικό bit (LSB), το σφάλμα κβαντισμού δεν είναι σημαντικά συσχετισμένο με το σήμα και εμφανίζει μία προσεγγιστικά ομοιόμορφη κατανομή. Το σφάλμα RMS , ωστόσο, προκύπτει από τη διακύμανση της κατανομής.
Εκτίμηση
[Επεξεργασία | επεξεργασία κώδικα]Εκτίμηση του μέγιστου
[Επεξεργασία | επεξεργασία κώδικα]Αμερόληπτη εκτιμήτρια της ελάχιστης διακύμανσης
[Επεξεργασία | επεξεργασία κώδικα]Δοθείσας μιας ομοιόμοφης κατανομή στο [0, b] με άγνωστο b, η αμερόληπτη εκτιμήτρια ελάχιστης διακύμανσης (UMVU) για το μέγιστο δίνεται από :όπου m είναι το μέγιστο του δείγματος και k είναι το μέγεθός του,δειγματοληψία χωρίς αντικατάσταση (αν και αυτή η διάκριση δεν έχει σχεδον καμία διαφορά απο τη συνεχή κατανομή). Αυτό γίνεται για τους ίδιους λόγους με την εκτίμηση για τη διακριτή κατανομή, και θεωρείται πολύ απλή περίπτωση της εκτίμησης της μέγιστης απόστασης. Αυτό το πρόβλημα είναι συνήθως γνωστό ως γερμανικό πρόβλημα των τανκ, εξαιτίας της εφαρμογής της μέγιστης εκτίμησης για την εκτίμηση της παραγωγής γερμανικών τανκ κατα τη διάρκεια του Β' Παγκοσμίου Πολέμου.
Εκτιμήτρια μέγιστης τύχης
[Επεξεργασία | επεξεργασία κώδικα]Η εκτιμήτρια μέγιστης τύχης δίνεται από:
όπου m είναι το μέγιστο του δείγματος, επίσης δηλωμένο ως η μέγιστη στατιστική σειρά του δείγματος.
Εκτιμήτρια της μεθόδου των ροπών
[Επεξεργασία | επεξεργασία κώδικα]Η εκτιμήτρια της μεθόδου των ροπών δίνεται από:
όπου είναι η μέση τιμή του δείγματος.
Εκτίμηση του μέσου
[Επεξεργασία | επεξεργασία κώδικα]Το μέσο της κατανομής (a + b) / 2 είναι και η μέση τιμή και η διάμεσος της ομοιόμορφης κατανομής. Αν και η μέση τιμή και η διάμεσος του δείγματος είναι αμερόληπτες εκτιμήτριες του μέσου, δεν είναι τόσο αποτελεσματικές όσο ο μέσος όρος του δείγματος, δηλαδή η αριθμητική μέση τιμή του μέγιστου και του ελάχιστου του δείγματος, που είναι η εκτιμήτρια UMVU του μέσου (και η εκτιμήτρια μέγιστης τύχης επίσης).
Διάστημα εμπιστοσύνης για το μέγιστο
[Επεξεργασία | επεξεργασία κώδικα]Ας είναι X1, X2, X3, ..., Xn ένα δείγμα από μια U( 0, L ) όπου L είναι το μέγιστο του πληθυσμόυ. Τότε X(n) = max( X1, X2, X3, ..., Xn ) έχει την πυκνότητα[5].
Το διάστημα εμπιστοσύνης για το εκτιμημένο μέγιστο του πληθυσμού είναι τότε ( X(n), X(n) / α1/n ) όπου 100 ( 1 - α )% είναι το επίπεδο αναζήτησης εμπιστοσύνης. Σε σύμβολα:
Αναφορές
[Επεξεργασία | επεξεργασία κώδικα]- Casella, George; Roger L. Berger (2001), Statistical inference (2nd ed.), ISBN 0-534-24312-6, LCCN 2001025794
Δείτε επίσης
[Επεξεργασία | επεξεργασία κώδικα]Παραπομπές
[Επεξεργασία | επεξεργασία κώδικα]- ↑ «Maximum entropy autoregressive conditional heteroskedasticity mode». Journal of Econometrics (Elsevier. 2011-06-02. Αρχειοθετήθηκε από το πρωτότυπο στις 2016-03-07. https://web.archive.org/web/20160307144515/http://wise.xmu.edu.cn/uploadfiles/paper-masterdownload/2009519932327055475115776.pdf. Ανακτήθηκε στις 22/5/2015.
- ↑ Casella & Berger 2001, p. 626. 2001.
- ↑ «galton.uchicago.edu» (PDF).
- ↑ «Χρήσιμες κατανομές» (PDF).
- ↑ Nechval KN, Nechval NA, Vasermanis EK, Makeev VY (2002) Constructing shortest-length confidence intervals. Transport and Telecommunication 3 (1) 95-103. (2002).