Torna indietro   Hardware Upgrade Forum > Software > Programmazione > Corsi, Tutorial e FAQ

Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB
Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB
Inizia l’era dell’AI storage. Durante l’Innovative Data Infrastructure Forum 2024, Huawei ha presentato OceanStor A800, una soluzione innovativa pensata per i carichi di lavoro legati all’intelligenza artificiale generativa
Recensione Google Pixel Tablet: in ritardo ma un ottimo primo passo!
Recensione Google Pixel Tablet: in ritardo ma un ottimo primo passo!
Il Pixel Tablet di Google arriva finalmente anche in Italia e lo fa quasi un anno dopo il suo debutto negli USA e in alcuni paesi nel mondo. Un ritardo che sembra però aver giovato al device che arriva performante e con molte funzionalità uniche che possono renderlo decisamente appetibile.
ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED i per professionisti dell'immagine
ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED i per professionisti dell'immagine
Un monitor veramente completo, per funzionalità e prestazioni. La presenza di un colorimetro integrato consente di agevolare le operazioni di calibrazione, anche per il mantenimento periodico delle prestazioni
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 09-05-2006, 12:24   #1
Ziosilvio
Moderatore
 
L'Avatar di Ziosilvio
 
Iscritto dal: Nov 2003
Messaggi: 16165
[Tutorial C/C++] Generazione di sequenze pseudorandom

Questa miniguida tratta la generazione di sequenze pseudorandom all'interno di un programma scritto in linguaggio C, mediante l'uso delle funzioni di libreria standard.
L'idea è di dare l'idea del funzionamento generico dei generatori pseudorandom, per poi passare all'implementazione.
Linguaggi di programmazione diversi richiederanno accorgimenti diversi.
Nel seguito, la scrittura "A = B mod N", che si legge "A è congruo a B modulo N", starà a significare che A-B è un multiplo di N. Analogamente, il resto della divisione di X per N sarà indicato come "X mod N".

Innanzitutto: perché pseudorandom?

Partiamo da un principio: nessuna sequenza generata con un algoritmo --- e tutte quelle ottenute mediante un computer lo sono --- può essere considerata veramente casuale.
In effetti, da un punto di vista intuitivo, una sequenza può dirsi casuale se nessuna sua descrizione è significativamente più corta della stringa stessa: ma nessuna procedura ricorsiva può soddisfare questo requisito per tutti i termini di una sequenza sufficientemente lunga. (Il discorso può essere reso rigoroso, ma non è nell'interesse di questa guida.) Per dirla con le parole di John von Neumann, "chiunque consideri metodi aritmetici di produzione di cifre casuali è, ovviamente, in uno stato di peccato".
D'altra parte, l'uso tipico delle sequenze pseudorandom è nella simulazione di fenomeni la cui descrizione richiederebbe un impiego eccessivo di risorse: non è quindi importante che le sequenza generate dal computer siano casuali, ma che lo sembrino. Ragion per cui, l'uso di un generatore pseudorandom al posto di uno random "puro" è, nella maggior parte dei casi, sufficiente; e spesso, consente maggiore controllo.


Il funzionamento di fondo

Una sequenza pseudorandom è costituita da una successione di valori x[j], nel quale i primi k valori x[0], x[1], ..., x[k-1] sono scelti in modo da essere difficilmente prevedibili, e ciascuno dei successivi x[j], j>=k, è ottenuto applicando una funzione F sui k precedenti valori x[j-1], x[j-2], ..., x[j-k].
La sequenza x[0], x[1], ..., x[k-1] dei primi k valori prende il nome di seme della sequenza.
E' allora ovvio come l'intera sequenza sia completamente determinata dal suo seme.
In modo empirico, un generatore pseudorandom si considera "buono" se il suo output "segue bene una certa distribuzione", di solito quella uniforme, e "risulta poco prevedibile": questo viene in genere valutato mediante test di tipo statistico.


Generatori congruenziali lineari

Un generatore congruenziale lineare ha la forma:
Codice:
x[j+1] = (a*x[j] + b) mod m
dove a è il moltiplicatore, b è l'incremento, ed m è il modulo. In questo caso, k=1, e F(x) = ax+b (mod m).
Un generatore siffatto può avere al più periodo m.
Teorema. [Knuth, p. 17] Affinché il generatore congruenziale lineare di moltiplicatore a, incremento b e modulo m abbia periodo m, condizione necessaria e sufficiente è che siano verificate le seguenti tre relazioni:
1) MCD(c,m) = 1;
2) a = 1 mod p per ogni primo p che divide m;
3) se m è multiplo di 4, allora a = 1 mod 4.


Le funzioni di libreria del C: rand e srand

Riportiamo le descrizioni del K&R:
Quote:
Codice:
int rand(void)
rand restituisce un intero pseudo-casuale compreso fra 0 e RAND_MAX, che vale almeno 32767.
Codice:
void srand(int seed)
srand usa seed come seme per una nuova sequenza di numeri pseudo-casuali. Il seme iniziale è 1.
Che cosa possiamo desumere da queste righe, riguardo al comportamento del generatore? Niente più di quello che c'è scritto: che rand può generare al più RAND_MAX+1 valori diversi, che la probabilità di ottenere uno qualsiasi di questi valori è uguale, e che la sequenza restituita sarà sempre la stessa se all'inizio non si imposta il seme dandogli un valore diverso. Non possiamo fare ipotesi sul periodo del generatore, e tantomeno sul suo tipo.


Sequenze uniformemente distribuite in un intervallo assegnato

Il modo "brutale" per ottenere un numero pseudorandom tra 0 ed N-1 è ovviamente:
Codice:
val = rand() % N;
Questo metodo viene dato per buono in alcuni manuali, ma contiene almeno due errori concettuali.
Anzitutto, non è detto che la distribuzione di val sia uniforme. Infatti lo standard garantisce che il valore restituito da rand sia uniformemente distribuito tra 0 e RAND_MAX inclusi: ne segue che, se N non è un divisore di RAND_MAX+1, allora la probabilità che val sia 0 è maggiore della probabilità che val sia N-1. (Di quanto, dipende dai valori di N e RAND_MAX.)
Il secondo, e più serio, è che val viene generata usando le cifre meno significative di rand. Ora, se k divide m, allora calcolare la classe resto modulo k della classe resto modulo m di un numero intero qualsiasi, è lo stesso che calcolare direttamente la classe resto modulo k: questo perché, quando si tolgono i multipli di m, si toglie già una parte dei multipli di k. Ne segue che, se rand è congruenziale lineare --- e non si può escludere che lo sia --- di moltiplicatore a, incremento b, e modulo m, e N divide m, allora rand() % N è congruenziale lineare di moltiplicatore a mod N, incremento b mod N, e modulo N: in particolare, il periodo di rand() % N non può superare N.
Il modo per evitare questo secondo inconveniente, è usare sempre tutte le cifre significative di rand: il modo più immediato per farlo, è trasformare il valore fornito da rand in un numero in virgola mobile in doppia precisione, uniformemente distribuito fra 0 incluso e 1 escluso:
Codice:
double frand(void)
{
    return rand() / (RAND_MAX+1.0);
}
Attenzione ai tipi: scrivere 1 anziché 1.0 porta a un generatore che restituisce sempre 0.0. ESERCIZIO: spiegare perché.
A questo punto, un intero tra 0 ed N-1 si ottiene così:
Codice:
val = (int)(frand()*N);
mentre un reale compreso tra a incluso e b escluso si ottiene così:
Codice:
val = a + (b-a)*frand();
Abbiamo così risolto il problema dell'uso delle cifre, in quanto vengono usate tutte.
Quello che resta da correggere, è l'uniformità della distribuzione. Infatti, la probabilità che val valga i, è pari a quella che frand sia compresa tra (double)i/N incluso e (double)(i+1)/N escluso, che non è detto sia 1.0/N, per lo stesso motivo per cui non è detto che rand() % N sia i con probabilità 1/N.
Per convincere i dubbiosi, facciamo un esempio con N=10, RAND_MAX=32767:
Codice:
val  x=frand()   r=frand()*(RAND_MAX+1)  k=rand()
 0   0.0<=x<0.1  0<=r<3276.8             0<=k<3277
 1   0.1<=x<0.2  3276.8<=r<6553.6        3277<k<6554
 2   0.2<=x<0.3  6553.6<=r<9830.4        6554<=k<9831
 3   0.3<=x<0.4  9830.4<=r<13107.2       9831<=k<13108
 4   0.4<=x<0.5  13107.2<=r<16384        13108<=k<16384
 5   0.5<=x<0.6  16384<=r<19660.8        16384<=k<19661
 6   0.6<=x<0.7  19660.8<=r<22937.6      19661<=k<22938
 7   0.7<=x<0.8  22937.6<=r<26214.4      22938<=k<26215
 8   0.8<=x<0.9  26214.4<=r<29491.2      26215<=k<29492
 9   0.9<=x<1.0  29491.2<=r<32768        29492<=k<32768
Come si può vedere, i valori 4 e 9 si possono ottenere in 3276 casi, contro i 3277 che determinano l'uscita di ciascuno degli altri numeri: di conseguenza, le probabilità di uscita di 4 e 9 sono 3276/32768 < 1/10, mentre gli altri numeri escono con probabilità 3277/32768 > 1/10. Potrebbe essere una tolleranza accettabile; ma potrebbe anche non esserlo.
Se un tale problema si presenta e va risolto, occorre fare una considerazione di carattere aritmetico. Siano n e k due numeri interi non negativi: esistono esattamente due numeri q ed r tali che n=kq+r e 0<=r<k; se n e k sono variabili di tipo int, allora q è n/k ed r è n%k.
Ne segue che il più grande intero divisibile per N che non supera RAND_MAX+1, è ((RAND_MAX+1)/N)*N: ma allora, se range <= RAND_MAX+1, possiamo ottenere una variabile intera uniformemente distribuita tra 0 incluso e range escluso nel modo seguente:
Codice:
int irand(int range)
{
    int imax, val;

    imax = ((RAND_MAX+1U)/range)*range;
    while ((val=rand()) >= imax)
        ;

    return (int)(((double)val/range)*range);
}
Qui la conversione di val a double è stata necessaria per ottenere un risultato utile, cosa che nell'implementazione di frand era stata garantita dall'aver aggiunto a RAND_MAX la costante 1.0, che è di tipo double. Qui abbiamo invece adoperato 1U per evitare problemi di segno.


Bibliografia
[K&R] B. W. Kernighan, D. M. Ritchie, "Linguaggio C --- Seconda edizione", Jackson Libri 1989
[Knuth] D. E. Knuth, "The Art of Computer Programming --- Volume 2: Seminumerical Algorithms"
__________________
Ubuntu è un'antica parola africana che significa "non so configurare Debian" Chi scherza col fuoco si brucia.
Scienza e tecnica: Matematica - Fisica - Chimica - Informatica - Software scientifico - Consulti medici
REGOLAMENTO DarthMaul = Asus FX505 Ryzen 7 3700U 8GB GeForce GTX 1650 Win10

Ultima modifica di Ziosilvio : 18-07-2009 alle 08:42. Motivo: Lieve modifica per evitare interi negativi.
Ziosilvio è offline   Rispondi citando il messaggio o parte di esso
Old 27-05-2009, 02:04   #2
Ikon O'Cluster
Registered User
 
Iscritto dal: May 2009
Messaggi: 300
Notevole, davvero notevole! Non c'avevo pensato... e dire che avere una distribuzione il più possibile uniforme è importante in molte applicazioni! Simili considerazioni possono individuare semantiche errate che altrimenti sarebbero quasi impossibili da individuare! Ora che ci penso un ambito in cui si usano i generatori di numeri casuali è la simulazione di reti di calcolatori, qui in un mio precedente lavoro ho utilizzato un algoritmo basato sul Tabu Search... ora che mi faccio due calcoli i valori casuali che utilizzavo non avevano una distribuzione uniforme!!! Questo potrebbe spiegare con molta probabilità alcuni fenomeni assurdi che uscivano in dei grafici e che abbiamo dovuto sagacemente occultare agli occhi del professore! Un esempio per dire: "bisogna sempre fare molta attenzione"!
Ikon O'Cluster è offline   Rispondi citando il messaggio o parte di esso
Old 24-01-2015, 22:42   #3
Snake91
Member
 
Iscritto dal: Feb 2008
Messaggi: 79
magnifico, stavo proprio cercando qualcosa di semplice per iniziare (prima di addentrarmi nel Knuth )
Snake91 è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Per Huawei l’IA è una questione di storage. Presentate soluzioni dedicate e un SSD da 128 TB Per Huawei l’IA è una questione di storag...
Recensione Google Pixel Tablet: in ritardo ma un ottimo primo passo! Recensione Google Pixel Tablet: in ritardo ma un...
ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED i per professionisti dell'immagine ASUS ProArt PA32UCXR: 4K, Quantum Dot e Mini-LED...
HUAWEI WATCH FIT 3: lo smartwatch che ridefinisce design e fitness! Recensione HUAWEI WATCH FIT 3: lo smartwatch che ridefinisc...
HONOR 200 Lite, lo smartphone economico per ritratti, selfie, e non solo. La recensione HONOR 200 Lite, lo smartphone economico per ritr...
Amazon, tutte le migliori offerte del we...
Ecco i 3 migliori tablet su Amazon per p...
I robot per le pulizie hanno prezzi sens...
Fire TV, Echo, Blink e Kindle sono tutti...
Oggi ci sono sconti molto interessanti s...
Spazzolini elettrici Oral-B in offerta s...
Corsair MP700 PRO SE: SSD PCIe 5 fino a ...
HUAWEI Pura 70 Ultra è il miglior...
Arriva in Italia la nuova gamma TV Samsu...
NVIDIA Grace Hopper è un successo...
Amazon Seconda Mano (ex Warehouse): pros...
Novità sulle Mappe di Apple: arri...
BYD insiste sull'Europa: nel 2025 second...
Il telescopio spaziale James Webb ha ril...
OPPO rende omaggio alle mamme con offert...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 11:08.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Served by www1v