grandGénérateur de nombres pseudo-aléatoiresSéquence d'appel
Y = grand(m, n, "bet", A, B)
Y = grand(m, n, "bin", N, p)
Y = grand(m, n, "nbn", N, p)
Y = grand(m, n, "chi", Df)
Y = grand(m, n, "nch", Df, Xnon)
Y = grand(m, n, "exp", Av)
Y = grand(m, n, "f", Dfn, Dfd)
Y = grand(m, n, "nf", Dfn, Dfd, Xnon)
Y = grand(m, n, "gam", shape, rate)
Y = grand(m, n, "nor", Av, Sd)
Y = grand(m, n, "geom", p)
Y = grand(m, n, "poi", mu)
Y = grand(m, n, "def")
Y = grand(m, n, "unf", Low, High)
Y = grand(m, n, "uin", Low, High)
Y = grand(m, n, "lgi")
Y = grand(m, n, o,..,"..",...)
Y = grand(X,...)
Y = grand(n, "mn", Mean, Cov)
Y = grand(n, "markov", P, x0)
Y = grand(n, "mul", nb, P)
Y = grand(n, "prm", vect)
S = grand("getgen")
grand("setgen", gen)
S = grand("phr2sd", phrase)
S = grand("getsd")
grand("setsd", S)
grand("setcgn", G)
S = grand("getcgn")
grand("initgn", I)
grand("setall", s1, s2, s3, s4)
grand("advnst", K)
Paramètresm, n, o
entiers, dimensions de la matrice de nombres aléatoires à obtenir YX
un vecteur, une matrice ou une hypermatrice dont seules les dimensions (m x n x ...) sont utilisées
Y
Vecteur, matrice ou hypermatrice des nombres aléatoires générés, de taille m x n x ... (encodage décimal)
S
résultat de l'action (une chaîne ou un vecteur colonne)
Description
Cette fonction produit des nombres aléatoires selon différentes distributions.
Les séquences d'appel :
Y = grand(m, n, "bet", A, B)
Y = grand(m, n, "bin", N, p)
Y = grand(m, n, "nbn", N, p)
Y = grand(m, n, "chi", Df)
Y = grand(m, n, "nch", Df, Xnon)
Y = grand(m, n, "exp", Av)
Y = grand(m, n, "f", Dfn, Dfd)
Y = grand(m, n, "nf", Dfn, Dfd, Xnon)
Y = grand(m, n, "gam", shape, rate)
Y = grand(m, n, "nor", Av, Sd)
Y = grand(m, n, "geom", p)
Y = grand(m, n, "poi", mu)
Y = grand(m, n, "def")
Y = grand(m, n, "unf", Low, High)
Y = grand(m, n, "uin", Low, High)
Y = grand(m, n, "lgi")
produisent une matrice de taille m-par-n de nombres aléatoires.
Toutes ces séquences peuvent être étendues pour créer une hypermatrice à plus de 2 dimensions, les
tailles (m, n, o,...) étant spécifiées avant le mot ".." indiquant le type de distribution statistique
souhaitée :
Le format du vecteur ou matrice ou hypermatrice aléatoire attendue peut également être spécifié par
où X de taille m-par-n... est une matrice
ou une hypermatrice dont seul le format est exploité et sert de modèle.
Les séquences d'appel :
Y = grand(n, "mn", Mean, Cov)
Y = grand(n, "markov", P, x0)
Y = grand(n, "mul", nb, P)
Y = grand(n, "prm", vect)
produisent une matrice de taille m-par-n
avec des entrées aléatoires.
Les séquences d'appel :
S = grand("getgen")
grand("setgen", gen)
S = grand("getsd")
grand("setsd", S)
S = grand("phr2sd", phrase)
grand("setcgn", G)
S = grand("getcgn")
grand("initgn", I)
grand("setall", s1, s2, s3, s4)
grand("advnst", K)
configurent ou interrogent les générateurs aléatoires.
Générer des nombres aléatoires selon une loi donnéebetaY = grand(m, n, "bet", A, B) génère des nombres aléatoires suivant
la loi beta de paramètres A and B.
La densité de cette loi est :
\dfrac{x^{A-1}(1-x)^{B-1}}{\beta(A,B)}
A et B devant être des réels 10^{-37}]]>.
Fonction(s) associée(s) : cdfbet.
binomialeY = grand(m, n, "bin", N, p) génère des nombres aléatoires suivant la loi
binomiale de paramètres N (entier str. positif) et p
(réel de [0,1]) : nombre de succès au cours de N épreuves de Bernouilli
de probabilité de succès p.
Fonctions associées : binomial, cdfbin.
binomiale négativeY = grand(m, n, "nbn", N, p) génère des nombres aléatoires suivant la loi binomiale
négative de paramètres N (entier str. positif) et p (réel
de ]0,1[) : nombre d'échecs avant d'obtenir N succès dans des épreuves
de Bernouilli de probabilité de succès p.
Fonction associée : cdfnbn.
chi 2Y = grand(m, n, "chi", Df) génère des nombres aléatoires suivant la loi du chi 2
à Df (réel > 0.0) degrés de liberté.
Fonction associée : cdfchi.
chi 2 non centréeY = grand(m, n, "nch", Df, Xnon) génère des nombres aléatoires suivant la loi du chi 2
non centrée à Df degrés de liberté (réel >= 1.0)
le paramètre de décentrage étant Xnonc (réel >= 0.0).
Fonction associée : cdfchn.
exponentielleY = grand(m, n, "exp", Av) génère des nombres aléatoires suivant la loi exponentielle
de moyenne Av (réel >= 0.0).
F variance ratioY = grand(m, n, "f", Dfn, Dfd) génère des nombres aléatoires suivant la loi F
(variance ratio) à Dfn (réel > 0.0) degrés de liberté au numérateur et
Dfd (réel > 0.0) degrés de liberté au dénominateur.
Fonction associée : cdff.
non central F variance ratioY = grand(m, n, "nf", Dfn, Dfd, Xnon) génère des nombres aléatoires suivant la loi
F (variance ratio) non centrée à Dfn (réel >= 1) degrés de liberté
au numérateur, et Dfd (réel > 0) degrés de liberté au dénominateur,
Xnonc (réel >= 0) étant le paramètre de décentrage.
Fonction associée : cdffnc.
gammaY = grand(m, n, "gam", shape, rate) génère des nombres aléatoires suivant la loi
gamma de paramètres shape (réel > 0) et scale
(réel > 0). La densité est :
\dfrac{ \textrm{rate}^{\textrm{shape}} x^{\textrm{shape}-1} e^{-\textrm{rate} x}}{\gamma(\textrm{shape}) }
Fonctions associées : gamma, cdfgam.
Gauss Laplace (normale)Y = grand(m, n, "nor", Av, Sd) génère des nombres aléatoires suivant la loi normale
de moyenne Av (réel) et d'écart type Sd
(réel >= 0).
Fonctions associées : cdfnor, erf.
multi normaleY = grand(n, "mn", Mean, Cov) génère n réalisations indépendantes de la
loi multi-normale ; Mean doit être un vecteur m-par-1 et Cov
une matrice m-par-m symétrique et définie positive, (Y est alors une
matrice m-par-n).
geometriqueY = grand(m, n, "geom", p)
génère des nombres aléatoires suivant la loi
geométrique de paramètre p : nombre
d'épreuves de Bernouilli (de probabilité de succès
p) jusqu'à obtenir un succès
(p doit appartenir à l'intervalle
[p_{min},1] (avec p_{min} = 1{,}3\times 10^{-307} ).
Y contient des nombres réels
positifs à valeur entière qui sont "le nombre de
tentatives nécessaire pour obtenir un succès" pour
chaque tirage.
markovY = grand(n, "markov", P, x0) génère n états successifs d'une chaîne
Markov décrite par la matrice de transition P. L'état initial est donné par
x0. Si x0 est une matrice de taille
m = size(x0, "*")
alors Y est une matrice de taille m x n. Y(i,:) étant le
chemin à partir de l'état initial x0(i).
multinomialeY = grand(n, "mul", nb, P) génère n réalisations indépendantes de la loi
Multinomiale : classer nb éventualités dans m catégories (mettre
nb "boules" dans m "boites"). P(i)
étant la probabilité qu'une éventualité soit de categorie i. P le vecteur des
probabilités est de taille m-1 (la probabilté de la catégorie m
étant 1-sum(P)). Y est alors de dimensions m x n,
chaque colonne Y(:,j) étant une réalisation de cette loi : Y(i,j)
est le nombre d'éventualités classées en catégorie i pour la j ème
réalisation (sum(Y(:,j)) = nb).
PoissonY = grand(m, n, "poi", mu) génère des nombres aléatoires suivant la loi de Poisson
de moyenne mu (réel >= 0.0).
Fonction associée : cdfpoi.
permutations aléatoiresY = grand(n, "prm", vect) génère n permutations aléatoire du
vecteur colonne (m x 1) vect.
vect peut être un scalaire, vecteur, matrices ou hypermatrice de réels,
complexes, entiers, booléens, polynômes ou chaînes de caractères; plein ou creux.
A cause de la structure de la pile, vect ne doit pas et ne peut pas être un vecteur ligne.
Cette fonctionnalité couvre la fonction Matlab randperm(),
car randperm(n) est équivalent à grand(1,'prm',(1:n)')
et randperm(n, k) s'obtient grâce à
grand(1,'prm',(1:n)'); ans(1:k).
uniforme (def)Y = grand(m, n, "def") génère des nombres aléatoires suivant la loi uniforme
sur [0,1[ (1 n'est jamais retourné).
uniforme (unf)Y = grand(m, n, "unf", Low, High) génère des nombres aléatoires suivant la loi
uniforme sur [Low, High[ (High is never return).
uniforme (uin)Y = grand(m, n, "uin", Low, High) génère des entiers aléatoires suivant la loi uniforme
sur [Low, High]. High
et Low doivent être des entiers tels que
(High-Low+1)
< 2147483561
.
uniforme (lgi)Y = grand(m, n, "lgi") retourne la sortie du générateur de base courant : des entiers
aléatoires suivant une loi uniforme sur :
[0, 2^32 - 1] for mt, kiss and fsultra;
[0, 2147483561] for clcg2;
[0, 2^31 - 2] for clcg4;
[0, 2^31 - 1] for urand.
Actions sur le(s) générateur(s) de base
Depuis Scilab-2.7 vous avez la possibilité de choisir parmi plusieurs générateurs de base
(donnant des entiers aléatoires suivant la loi "lgi") :
mt
Le Mersenne-Twister de M. Matsumoto and T. Nishimura, période d'environ 2^19937,
état interne donné par 624 entiers (plus un index); c'est le générateur
par défaut.
kiss
Le Keep It Simple Stupid de G. Marsaglia, période d'environ 2^123,
état interne donné par 4 entiers.
clcg2
Une combinaison de 2 générateurs linéaires congruentiels de P. L'Ecuyer,
période d'environ 2^61, état interne donné par 2 entiers ;
c'était le seul générateur de base utilisé auparavent par grand (cette
version est cependant légèrement différente de l'ancienne).
clcg4
Une combinaison de 4 générateurs linéaires congruentiels de P. L'Ecuyer,
période d'environ 2^121, état interne donné par 4 entiers ; ce générateur
peut être partagé en 101 générateur virtuels (en fait la suite de
longueur 2^121 peut être découpée en 101 sous-suites) ce qui peut
être utile dans certains cas (voir 'Actions specifiques à clcg4' et
'Exemple d'utilisation de clcg4').
fsultra
Un générateur SWB (subtract-with-borrow) mixé avec un générator congruentiel
concu par Arif Zaman et George Marsaglia. Sa période est supérieure à 10^356,
et son état interne est constitué d'un tableau de 37 entiers, d'un index sur
ce tableau et d'un drapeau (0 ou 1) ainsi qu'un autre entier donnant l'état interne
du générateur congruentiel.
urand
Le générateur de base utilisé par la fonction
rand, état interne constitué d'un entier, période de
2^31.
Ce generateur est fondé sur "Urand, A Universal Random Number Generator" By,
Michael A. Malcolm, Cleve B. Moler, Stan-Cs-73-334, January 1973, Computer
Science Department, School Of Humanities And Sciences, Stanford University.
C'est le plus rapide de cette liste, mais ses qualités statistiques
sont inférieures aux autres générateurs.
Actionsaction = "getgen"S = grand("getgen") retourne le nom du générateur de base actuel (S est
l'une des chaînes de caractères "mt", "kiss", "clcg2", "clcg4", "urand", "fsultra").
action = "setgen"grand("setgen", gen) permet de changer le générateur de base : gen
doit être l'une des chaînes de caractères "mt", "kiss", "clcg2", "clcg4", "urand", "fsultra".
En cas de succès la fonction retourne cette même chaîne.
action = "getsd"S = grand("getsd") retourne l'état interne actuel (les 'germes' dans l'ancienne
appelation quoique ce terme désigne plutôt l'état initial) du générateur de base courant ;
S est un vecteur colonne (d'entiers) de dimension 625
pour mt (la première composante étant un 'index' sur l'état, c-a-d un entier de l'intervalle
[1,624]), 4
pour kiss, 2 pour clcg2 , 40pour fsultra, 4 pour clcg4
(pour ce dernier vous obtenez l'état interne du générateur virtuel courant), et 1
pour urand.
action = "setsd"grand("setsd", S), grand("setsd", s1[, s2, s3, s4]) impose l'état interne du générateur de
base courant :
pour mtS est un vecteur d'entiers de dimension 625 (la première composante
étant un index sur [1,624]), les 624 dernières composantes doivent
être dans [0,2^32[) (mais ne doivent pas être toutes nulles) ; une initialisation
plus simple est possible (et recommandée) en donnant un seul entier s1 (s1 appartenant
à [0,2^32[) ;
pour kiss4 entiers s1, s2, s3, s4 dans [0,2^32[ doivent être
fournis ;
pour clcg22 entiers s1 dans [1, 2147483562] et s2
dans [1, 2147483398] doivent être fournis ;
pour clcg44 entiers s1 dans [1, 2147483646], s2
dans [1, 2147483542], s3 dans [1, 2147483422],
s4 dans [1, 2147483322] sont requis ;
ATTENTION : avec clcg4 vous positionnez l'état interne du générateur virtuel
courant mais vous perdez alors la synchronisation avec les autres générateurs virtuels.
(=> si vous utilisez clcg4 avec différents générateurs virtuels, il faut utiliser
l'option "setall" qui permet de changer l'état interne (du générateur numéro 0) tout en
recalculant l'état initial des 100 autres générateurs virtuels).
pour urand1 entier s1 appartenant à
[0, 2^31[ est requis.
for fsultraS est un vecteur de 40 entiers (son premier élément doit être dans
l'intervalle[0, 37], son deuxième (drapeau) doit être 0 ou 1, le troisième un
entier de [1, 2^32[ et les 37 composantes suivantes, des entiers de [0, 2^32[) ; il est recommandé
d'utiliser l'autre procédure d'initialisation (plus simple) avec deux entiers s1 et
s2 de [0, 2^32[.
action = "phr2sd"Sd = grand("phr2sd", phrase) étant donnée une chaîne de caractères phrase
cet appel retourne un vecteur 1 x 2 qui peut être utilisé comme
état interne pour un générateur de base (initialement adapté pour clcg2).
Options specifiques à clcg4
Le générateur clcg4 peut être utilisé comme les autres mais il offre l'avantage de pouvoir être
découpé en (101) générateurs virtuels différents, c-a-d avec des séquences sans
intersection (quand vous utilisez un générateur classique vous pouvez changer l'état initial
de façon à obtenir une autre séquence mais vous n'êtes pas complètement sûr d'obtenir une
séquence complètement différente). Chaque générateur virtuel correspond à une séquence de
longueur 2^72 qui est de plus découpée en V = 2^31 segments de longueur
W = 2^41. Pour un générateur virtuel donné vous pouvez retourner au début de la séquence
ou au début du segment ou bien au début du segment suivant.
Vous pouvez aussi changer l'état initial du générateur 0 avec l'option
"setall" qui recalcule l'état initial des autres générateurs virtuels de sorte à obtenir
la synchronisation entre les générateurs (c-a-d qu'en fonction du nouvel état initial du générateur
0 l'état initial des générateurs 1..100 sont recalculés de façon à
obtenir 101 séquences qui ne s'intersectent pas).
action = "setcgn"grand("setcgn", G) sélectionne le générateur virtuel numéro G :
lorsque le générateur de base courant est clcg4, c'est le générateur virtuel G
qui sera alors utilisé ; les 101 générateurs virtuels sont numérotés
0,1,...,100 (ainsi G doit être un entier de l'intervalle
[0, 100]) ; par défaut le générateur virtuel courant est celui de numéro
0.
action = "getcgn"S = grand("getcgn") retourne le numéro du générateur
virtuel courant.
action = "initgn"grand("initgn", I) réinitialise l'état du générateur virtuel courant :
I = -1remet l'état à sa valeur initialeI = 0remet l'état au début du segment courantI = 1
positionne l'état au début du segment suivant et met à jour les valeurs définissant
le segment courant (vous ne pouvez pas revenir au début du segment précédent).
action = "setall"grand("setall", s1, s2, s3, s4) impose l'état interne du générateur virtuel
de numéro 0 à s1, s2, s3, s4. L'état initial des autres générateurs est
alors reconstruit (de façon à obtenir 101 séquences qui ne s'intersectent pas). Voir
l'action "setsd" pour les contraintes sur s1, s2, s3, s4.
action = "advnst"grand("advnst", K) avance l'état du générateur virtuel courant de 2^K
valeurs et réinitialise l'état initial (du générateur virtuel courant) à
ce nouvel état.
Exemples
Dans l'exemple suivant, nous produisons des nombres aléatoires
associés à différentes lois de distribution et dessinons les histogrammes
associés.
R = grand(400, 800, "nor", 0, 1);
histplot(10, R);
xtitle("Nombres aléatoires (loi normale) par grand", "X", "Fréquence");
R = grand(400, 800, "def");
histplot(10, R);
xtitle("Nombres aléatoires uniformes par grand", "X", "Fréquence");
R = grand(400, 800, "poi", 5);
histplot(10, R);
xtitle("Nombres aléatoires (loi de Poisson) par grand", "X", "Fréquence");
Dans l'exemple suivant, nous produisons des nombres aléatoires
suivant la loi exponentielle et comparons ensuite la distribution empirique
et la fonction de distribution théorique.
lambda = 1.6;
N = 100000;
X = grand(1, N, "exp", lambda);
classes = linspace(0, 12, 25);
histplot(classes, X)
x = linspace(0, 12, 25);
y = (1/lambda)*exp(-(1/lambda)*x);
plot(x, y, "ro-");
legend(["Empirique" "Theorique"]);
xtitle("Loi exponentielle par grand", "X", "Fréquence");
Dans l'exemple suivant, nous générons des nombres aléatoires selon la distribution
gamma et comparons la distribution empirique et la loi de distribution théorique.
N = 10000;
A = 10;
B = 4;
R = grand(1, N, "gam", A, B);
XS = gsort(R, "g", "i")';
PS = (1:N)'/N;
P = cdfgam("PQ", XS, A*ones(XS), B*ones(XS));
plot(XS, PS, "b-");
plot(XS, P, "r-");
legend(["Empirique" "Théorique"]);
xtitle("Fonction de distribution cumulée de nombres aléatoires selon la loi Gamma", "X", "F");
Dans l'exemple suivant, nous générons 10 entiers aléatoires dans l'intervalle [1, 365].
Dans l'exemple suivant, nous générons 12 permutations de l'ensemble [1,2,...,7].
Les 12 permutations sont stockées colonne par colonne.
L'exemple suivant génère une hypermatrice 10-par-10-par-10
de nombre aléatoires provenant de la distribution "normale" et affiche les histogrammes associés.
Le graphes montrent les première et dernière couches de la matrice.
R = grand(10,10,10,"nor",0,1);
subplot(1,2,1)
hist3d(R(:,:,1));
xtitle("Couche 1");
subplot(1,2,2)
hist3d(R(:,:,10));
xtitle("Couche 10");
Produire des nombres prévisibles ou moins prévisibles
Les générateurs pseudo aléatoires sont fondés sur des séquences déterministes.
Pour produire des simulations reproductibles, la graine du générateur est constante,
de telle sorte que la séquence est la même d'une session à l'autre.
En conséquence, par défaut, les premiers nombres produis par grand
sont toujours les mêmes.
Dans certaines situations, nous peut vouloir initialiser la graine du générateur
dans le but de produire des nombres moins prédictibles.
Dans ce cas, on peut initialiser la graine avec la sortie de la fonction getdate :
Exemple d'utilisation de clcg4
On cherche à comparer deux techniques statistiques sur des données de tailles différentes.
La première, utilisant le 'bootstrapping' est supposée a priori aussi précise que
la deuxième technique (utilisant uniquement la force brute) tout en utilisant moins
de données. Pour la première méthode, un ensemble de données de taille n1, uniformément
distribuée entre 25 et 50 devra être généré puis analysé par la méthode. Pour la
seconde méthode, on procède de même avec une taille n2 à choisir entre 100 et 200. Ce processus
est répété 1000 fois. Pour la réduction de la variance, on veut que les nombres aléatoires
utilisés dans les deux méthodes soient les mêmes pour chacune des 1000 comparaisons.
Comme la deuxième méthode utilise plus de nombres aléatoires, la synchronisation
peut être difficile si l'on utilise un générateur classique. Avec un générateur
comme clcg4 c'est par contre très simple : utilisez le générateur 0 pour obtenir
la taille n1 du jeux de données et le générateur 1 pour obtenir les données.
Avec le générateur 0 tirer la taille n2 puis resélectionner le générateur 1 et revenez
au début du segment courant pour obtenir les n2 données pour la deuxième méthode : ainsi
les données initiales (les n1 premieres) sont les mêmes pour les deux méthodes.
Pour la comparaison suivante, il suffit d'avancer le générateur 1 au segment suivant,
etc...
Voir aussi
rand
sprand
ssrand