Random Numbers

줄리아에서의 난수 생성은 기본적으로 Xoshiro256++ 알고리즘을 사용하며, Task별 상태를 가집니다. 다른 RNG 유형은 AbstractRNG 유형을 상속하여 플러그인할 수 있으며, 이를 통해 여러 개의 난수 스트림을 얻을 수 있습니다.

Random 패키지에서 내보내는 PRNG(의사 난수 생성기)는 다음과 같습니다:

TaskLocalRNG: 현재 활성화된 작업 로컬 스트림의 사용을 나타내는 토큰으로, 부모 작업에서 결정적으로 시드가 생성되거나 프로그램 시작 시 RandomDevice(시스템 무작위성 사용)로 시드가 생성됩니다.
Xoshiro: Xoshiro256++ 알고리즘을 사용하여 작은 상태 벡터와 높은 성능으로 고품질의 난수 스트림을 생성합니다.
RandomDevice: OS에서 제공하는 엔트로피. 이는 암호학적으로 안전한 난수(CS(P)RNG)에 사용될 수 있습니다.
MersenneTwister: 이전 버전의 Julia에서 기본값이었던 대체 고품질 PRNG로, 꽤 빠르지만 상태 벡터를 저장하고 난수 시퀀스를 생성하는 데 훨씬 더 많은 공간이 필요합니다.

대부분의 랜덤 생성과 관련된 함수는 선택적 AbstractRNG 객체를 첫 번째 인수로 받아들입니다. 일부는 랜덤 값의 배열을 생성하기 위해 차원 사양 dims... (튜플로 제공될 수도 있음)도 허용합니다. 다중 스레드 프로그램에서는 일반적으로 스레드나 작업마다 서로 다른 RNG 객체를 사용하여 스레드 안전성을 확보해야 합니다. 그러나 기본 RNG는 Julia 1.3부터 스레드 안전하며(버전 1.6까지는 스레드별 RNG를 사용하고, 그 이후에는 작업별 RNG를 사용합니다).

제공된 RNG는 다음 유형의 균일 난수를 생성할 수 있습니다: Float16, Float32, Float64, BigFloat, Bool, Int8, UInt8, Int16, UInt16, Int32, UInt32, Int64, UInt64, Int128, UInt128, BigInt (또는 이러한 유형의 복소수). 난수 부동 소수점 숫자는 $[0, 1)$에서 균일하게 생성됩니다. BigInt가 무한 정수를 나타내므로, 구간을 지정해야 합니다 (예: rand(big.(1:6))).

또한, 일부 AbstractFloat 및 Complex 유형에 대해 정규 분포 및 지수 분포가 구현되어 있습니다. 자세한 내용은 randn 및 randexp를 참조하십시오.

다른 분포에서 무작위 숫자를 생성하려면 Distributions.jl 패키지를 참조하세요.

Warning

무작위 숫자가 생성되는 정확한 방식은 구현 세부사항으로 간주되기 때문에, 버전 변경 후 생성되는 숫자 스트림이 버그 수정 및 속도 개선으로 인해 변경될 수 있습니다. 단위 테스트 중 특정 시드나 생성된 숫자 스트림에 의존하는 것은 권장되지 않으며, 대신 해당 메서드의 속성을 테스트하는 것을 고려해야 합니다.

Random numbers module

Random.Random — Module

무작위

무작위 수 생성을 위한 지원. rand, randn, AbstractRNG, MersenneTwister, 및 RandomDevice를 제공합니다.

source

Random generation functions

Base.rand — Function

rand([rng=default_rng()], [S], [dims...])

S로 지정된 값 집합에서 무작위 요소 또는 무작위 요소 배열을 선택합니다. S는 다음과 같을 수 있습니다.

인덱스 가능한 컬렉션(예: 1:9 또는 ('x', "y", :z))
AbstractDict 또는 AbstractSet 객체
문자열(문자 집합으로 간주됨), 또는
지정된 값 집합에 해당하는 아래 목록의 유형
- 구체적인 정수 유형은 typemin(S):typemax(S)에서 샘플링합니다(지원되지 않는 BigInt 제외).
- 구체적인 부동 소수점 유형은 [0, 1)에서 샘플링합니다.
- 구체적인 복소수 유형 Complex{T}는 T가 샘플링 가능한 유형인 경우, T에 해당하는 값 집합에서 실수 및 허수 성분을 독립적으로 가져오지만, T가 샘플링 불가능한 경우 지원되지 않습니다.
- 모든 <:AbstractChar 유형은 유효한 유니코드 스칼라 집합에서 샘플링합니다.
- 사용자 정의 유형 및 값 집합; 구현 지침은 Random API에 연결하기를 참조하십시오.
- 알려진 크기의 튜플 유형이며 S의 각 매개변수가 샘플링 가능한 유형인 경우; S 유형의 값을 반환합니다. Tuple{Vararg{T}}(크기가 불명확한 튜플 유형) 및 Tuple{1:2}(값으로 매개변수화된 튜플 유형)는 지원되지 않습니다.
- Pair 유형, 예: Pair{X, Y}로 rand가 X 및 Y에 대해 정의된 경우, 무작위 쌍이 생성됩니다.

S의 기본값은 Float64입니다. 선택적 rng 외에 하나의 인수만 전달되고 Tuple인 경우, 값 집합(S)의 컬렉션으로 해석되며 dims로 해석되지 않습니다.

정규 분포 숫자에 대해서는 randn를, 제자리에서의 동등한 함수에 대해서는 rand! 및 randn!를 참조하십시오.

Julia 1.1

S를 튜플로 지원하려면 최소한 Julia 1.1이 필요합니다.

Julia 1.11

S를 Tuple 유형으로 지원하려면 최소한 Julia 1.11이 필요합니다.

예제

julia> rand(Int, 2)
2-element Array{Int64,1}:
 1339893410598768192
 1575814717733606317

julia> using Random

julia> rand(Xoshiro(0), Dict(1=>2, 3=>4))
3 => 4

julia> rand((2, 3))
3

julia> rand(Float64, (2, 3))
2×3 Array{Float64,2}:
 0.999717  0.0143835  0.540787
 0.696556  0.783855   0.938235

Note

rand(rng, s::Union{AbstractDict,AbstractSet})의 복잡도는 s의 길이에 대해 선형이며, 상수 복잡도의 최적화된 방법이 사용 가능한 경우(예: Dict, Set 및 밀집 BitSet의 경우)입니다. 몇 번 이상의 호출을 위해서는 대신 rand(rng, collect(s))를 사용하거나 적절하게 rand(rng, Dict(s)) 또는 rand(rng, Set(s))를 사용하십시오.

source

Random.rand! — Function

rand!([rng=default_rng()], A, [S=eltype(A)])

배열 A를 무작위 값으로 채웁니다. S가 지정된 경우(S는 타입 또는 컬렉션일 수 있으며, 자세한 내용은 rand를 참조하십시오), 값은 S에서 무작위로 선택됩니다. 이는 copyto!(A, rand(rng, S, size(A)))와 동일하지만 새로운 배열을 할당하지 않습니다.

예제

julia> rand!(Xoshiro(123), zeros(5))
5-element Vector{Float64}:
 0.521213795535383
 0.5868067574533484
 0.8908786980927811
 0.19090669902576285
 0.5256623915420473

source

Random.bitrand — Function

bitrand([rng=default_rng()], [dims...])

무작위 부울 값의 BitArray를 생성합니다.

예제

julia> bitrand(Xoshiro(123), 10)
10-element BitVector:
 0
 1
 0
 1
 0
 1
 0
 0
 1
 1

source

Base.randn — Function

randn([rng=default_rng()], [T=Float64], [dims...])

평균 0과 표준 편차 1을 가진 T 유형의 정규 분포 난수를 생성합니다. 선택적 dims 인수를 사용하여 이러한 숫자의 크기가 dims인 배열을 생성합니다. Julia의 표준 라이브러리는 rand를 구현하는 모든 부동 소수점 유형에 대해 randn을 지원합니다. 예를 들어, Base 유형인 Float16, Float32, Float64 (기본값) 및 BigFloat와 그들의 Complex 대응형이 있습니다.

(T가 복소수일 때, 값은 분산 1의 원형 대칭 복소 정규 분포에서 추출되며, 이는 실수 및 허수 부분이 평균 0과 분산 1/2를 가진 독립적인 정규 분포를 갖는 것에 해당합니다).

제자리에서 작동하기 위해 randn!도 참조하십시오.

예제

단일 난수 생성 (기본 Float64 유형 사용):

julia> randn()
-0.942481877315864

정규 난수 행렬 생성 (기본 Float64 유형 사용):

julia> randn(2,3)
2×3 Matrix{Float64}:
  1.18786   -0.678616   1.49463
 -0.342792  -0.134299  -1.45005

사용자 정의 시드를 사용하여 난수 생성기 rng를 설정하고 이를 사용하여 난수 Float32 또는 ComplexF32 난수 행렬을 생성하는 예:

julia> using Random

julia> rng = Xoshiro(123);

julia> randn(rng, Float32)
-0.6457307f0

julia> randn(rng, ComplexF32, (2, 3))
2×3 Matrix{ComplexF32}:
  -1.03467-1.14806im  0.693657+0.056538im   0.291442+0.419454im
 -0.153912+0.34807im    1.0954-0.948661im  -0.543347-0.0538589im

source

Random.randn! — Function

randn!([rng=default_rng()], A::AbstractArray) -> A

배열 A를 정규 분포(평균 0, 표준 편차 1)를 따르는 난수로 채웁니다. rand 함수도 참조하세요.

예제

julia> randn!(Xoshiro(123), zeros(5))
5-element Vector{Float64}:
 -0.6457306721039767
 -1.4632513788889214
 -1.6236037455860806
 -0.21766510678354617
  0.4922456865251828

source

Random.randexp — Function

randexp([rng=default_rng()], [T=Float64], [dims...])

1의 스케일을 가진 지수 분포에 따라 타입 T의 난수를 생성합니다. 선택적으로 이러한 난수의 배열을 생성할 수 있습니다. Base 모듈은 현재 Float16, Float32, 및 Float64 (기본값) 타입에 대한 구현을 제공합니다.

예제

julia> rng = Xoshiro(123);

julia> randexp(rng, Float32)
1.1757717f0

julia> randexp(rng, 3, 3)
3×3 Matrix{Float64}:
 1.37766  0.456653  0.236418
 3.40007  0.229917  0.0684921
 0.48096  0.577481  0.71835

source

Random.randexp! — Function

randexp!([rng=default_rng()], A::AbstractArray) -> A

배열 A를 스케일 1인 지수 분포를 따르는 랜덤 숫자로 채웁니다.

예시

julia> randexp!(Xoshiro(123), zeros(5))
5-element Vector{Float64}:
 1.1757716836348473
 1.758884569451514
 1.0083623637301151
 0.3510644315565272
 0.6348266443720407

source

Random.randstring — Function

randstring([rng=default_rng()], [chars], [len=8])

길이 len의 임의 문자열을 생성하며, chars의 문자로 구성됩니다. chars는 기본적으로 대문자 및 소문자와 숫자 0-9의 집합으로 설정됩니다. 선택적 rng 인자는 난수 생성기를 지정합니다. Random Numbers를 참조하세요.

예제

julia> Random.seed!(3); randstring()
"Lxz5hUwn"

julia> randstring(Xoshiro(3), 'a':'z', 6)
"iyzcsm"

julia> randstring("ACGT")
"TGCTCCTC"

!!! 주의 chars는 Char 또는 UInt8 타입의 문자 컬렉션일 수 있으며 (더 효율적), rand가 그로부터 임의로 문자를 선택할 수 있어야 합니다.

source

Subsequences, permutations and shuffling

Random.randsubseq — Function

randsubseq([rng=default_rng(),] A, p) -> Vector

주어진 배열 A의 무작위 부분 수열로 구성된 벡터를 반환합니다. 여기서 A의 각 요소는 독립 확률 p로 포함됩니다(순서대로). (복잡도는 p*length(A)에 선형적이므로, 이 함수는 p가 작고 A가 클 때도 효율적입니다.) 기술적으로 이 과정은 A의 "베르누이 샘플링"으로 알려져 있습니다.

예제

julia> randsubseq(Xoshiro(123), 1:8, 0.3)
2-element Vector{Int64}:
 4
 7

source

Random.randsubseq! — Function

randsubseq!([rng=default_rng(),] S, A, p)

randsubseq와 유사하지만, 결과는 S에 저장됩니다(필요에 따라 크기가 조정됨).

예제

julia> S = Int64[];

julia> randsubseq!(Xoshiro(123), S, 1:8, 0.3)
2-element Vector{Int64}:
 4
 7

julia> S
2-element Vector{Int64}:
 4
 7

source

Random.randperm — Function

randperm([rng=default_rng(),] n::Integer)

길이 n의 무작위 순열을 생성합니다. 선택적 rng 인자는 무작위 수 생성기를 지정합니다(자세한 내용은 무작위 수 참조). 결과의 요소 유형은 n의 유형과 동일합니다.

임의의 벡터를 무작위로 섞으려면 shuffle 또는 shuffle!를 참조하세요.

Julia 1.1

Julia 1.1에서는 randperm이 eltype(v) == typeof(n)인 벡터 v를 반환하는 반면, Julia 1.0에서는 eltype(v) == Int입니다.

예제

julia> randperm(Xoshiro(123), 4)
4-element Vector{Int64}:
 1
 4
 2
 3

source

Random.randperm! — Function

randperm!([rng=default_rng(),] A::Array{<:Integer})

A에서 길이 length(A)의 무작위 순열을 생성합니다. 선택적 rng 인자는 난수 생성기를 지정합니다(자세한 내용은 Random Numbers 참조). 임의의 벡터를 무작위로 섞으려면 shuffle 또는 shuffle!를 참조하세요.

예제

julia> randperm!(Xoshiro(123), Vector{Int}(undef, 4))
4-element Vector{Int64}:
 1
 4
 2
 3

source

Random.randcycle — Function

randcycle([rng=default_rng(),] n::Integer)

길이 n의 무작위 순환 순열을 생성합니다. 선택적 rng 인자는 난수 생성기를 지정하며, 무작위 수를 참조하십시오. 결과의 요소 유형은 n의 유형과 동일합니다.

여기서 "순환 순열"은 모든 요소가 단일 사이클 내에 존재함을 의미합니다. n > 0인 경우, 가능한 순환 순열의 수는 $(n-1)!$이며, 이는 균일하게 샘플링됩니다. n == 0인 경우, randcycle은 빈 벡터를 반환합니다.

randcycle!는 이 함수의 제자리 변형입니다.

Julia 1.1

Julia 1.1 이상에서는 randcycle이 eltype(v) == typeof(n)인 벡터 v를 반환하는 반면, Julia 1.0에서는 eltype(v) == Int입니다.

예제

julia> randcycle(Xoshiro(123), 6)
6-element Vector{Int64}:
 5
 4
 2
 6
 3
 1

source

Random.randcycle! — Function

randcycle!([rng=default_rng(),] A::Array{<:Integer})

A에서 길이 n = length(A)의 무작위 순환 순열을 생성합니다. 선택적 rng 인자는 난수 생성기를 지정하며, Random Numbers를 참조하십시오.

여기서 "순환 순열"은 모든 요소가 단일 사이클 내에 존재함을 의미합니다. 만약 A가 비어 있지 않다면(n > 0), 가능한 순환 순열의 수는 $(n-1)!$이며, 이는 균일하게 샘플링됩니다. 만약 A가 비어 있다면, randcycle!는 이를 변경하지 않습니다.

randcycle는 새로운 벡터를 할당하는 이 함수의 변형입니다.

예시

julia> randcycle!(Xoshiro(123), Vector{Int}(undef, 6))
6-element Vector{Int64}:
 5
 4
 2
 6
 3
 1

source

Random.shuffle — Function

shuffle([rng=default_rng(),] v::AbstractArray)

v의 무작위로 섞인 복사본을 반환합니다. 선택적 rng 인자는 난수 생성기를 지정합니다(자세한 내용은 난수 참조). v를 제자리에서 섞으려면 shuffle!를 참조하세요. 무작위로 섞인 인덱스를 얻으려면 randperm를 참조하세요.

예제

julia> shuffle(Xoshiro(123), Vector(1:10))
10-element Vector{Int64}:
  5
  4
  2
  3
  6
 10
  8
  1
  9
  7

source

Random.shuffle! — Function

shuffle!([rng=default_rng(),] v::AbstractArray)

제자리에서 버전 shuffle: 선택적으로 난수 생성기 rng를 제공하여 v를 제자리에서 무작위로 섞습니다.

예제

julia> shuffle!(Xoshiro(123), Vector(1:10))
10-element Vector{Int64}:
  5
  4
  2
  3
  6
 10
  8
  1
  9
  7

source

Generators (creation and seeding)

Random.default_rng — Function

Random.default_rng() -> rng

기본 전역 난수 생성기(RNG)를 반환합니다. 이는 명시적인 RNG가 제공되지 않을 때 rand 관련 함수에서 사용됩니다.

Random 모듈이 로드되면 기본 RNG는 무작위로 시드가 설정됩니다. Random.seed!()를 통해: 이는 새로운 줄리아 세션이 시작될 때마다 rand()의 첫 번째 호출이 다른 결과를 생성함을 의미합니다. 단, 먼저 seed!(seed)가 호출되지 않는 한 그렇습니다.

스레드 안전합니다: 서로 다른 스레드는 default_rng()에서 rand 관련 함수를 안전하게 동시에 호출할 수 있습니다. 예: rand(default_rng()).

Note

기본 RNG의 유형은 구현 세부 사항입니다. 줄리아의 다양한 버전에서 기본 RNG가 항상 동일한 유형을 가지거나 주어진 시드에 대해 동일한 난수 스트림을 생성할 것이라고 기대하지 마십시오.

Julia 1.3

이 함수는 Julia 1.3에서 도입되었습니다.

source

Random.seed! — Function

seed!([rng=default_rng()], seed) -> rng
seed!([rng=default_rng()]) -> rng

난수 생성기를 다시 시드합니다: rng는 seed가 제공될 때만 재현 가능한 숫자 시퀀스를 제공합니다. 일부 RNG는 RandomDevice와 같이 시드를 허용하지 않습니다. seed! 호출 후, rng는 동일한 시드로 초기화된 새로 생성된 객체와 동등합니다. 허용되는 시드의 유형은 rng의 유형에 따라 다르지만, 일반적으로 정수 시드는 작동해야 합니다.

rng가 지정되지 않으면 공유 작업 로컬 생성기의 상태를 시드하는 것으로 기본 설정됩니다.

예제

julia> Random.seed!(1234);

julia> x1 = rand(2)
2-element Vector{Float64}:
 0.32597672886359486
 0.5490511363155669

julia> Random.seed!(1234);

julia> x2 = rand(2)
2-element Vector{Float64}:
 0.32597672886359486
 0.5490511363155669

julia> x1 == x2
true

julia> rng = Xoshiro(1234); rand(rng, 2) == x1
true

julia> Xoshiro(1) == Random.seed!(rng, 1)
true

julia> rand(Random.seed!(rng), Bool) # 재현 불가능
true

julia> rand(Random.seed!(rng), Bool) # 재현 불가능
false

julia> rand(Xoshiro(), Bool) # 재현 불가능
true

source

Random.AbstractRNG — Type

AbstractRNG

MersenneTwister 및 RandomDevice와 같은 난수 생성기의 슈퍼타입입니다.

source

Random.TaskLocalRNG — Type

TaskLocalRNG

TaskLocalRNG는 스레드가 아닌 작업에 로컬한 상태를 가지고 있습니다. 작업 생성 시 부모 작업의 상태에서 시드가 설정되지만, 부모의 RNG 상태는 진행되지 않습니다.

장점으로는 TaskLocalRNG가 매우 빠르며, 스케줄러 결정과 무관하게 재현 가능한 다중 스레드 시뮬레이션을 허용합니다(경쟁 조건을 제외하고). 작업 생성에 대한 결정에 스레드 수가 사용되지 않는 한, 시뮬레이션 결과는 사용 가능한 스레드/CPU 수와도 독립적입니다. 난수 스트림은 하드웨어의 세부 사항에 의존하지 않아야 하며, 엔디안 및 가능성 있는 워드 크기까지 포함됩니다.

current_task()에서 반환된 작업이 아닌 다른 작업의 RNG를 사용하거나 시드하는 것은 정의되지 않은 동작입니다: 대부분의 경우 작동하지만, 때때로 조용히 실패할 수 있습니다.

seed!로 TaskLocalRNG()를 시드할 때, 전달된 시드는(있는 경우) 어떤 정수도 될 수 있습니다.

Julia 1.11

음수 정수 시드로 TaskLocalRNG()를 시드하는 것은 최소한 Julia 1.11이 필요합니다.

Julia 1.10

Julia 1.10부터 작업 생성이 더 이상 부모 작업의 RNG 상태를 진행하지 않습니다.

source

Random.Xoshiro — Type

Xoshiro(seed::Union{Integer, AbstractString})
Xoshiro()

Xoshiro256++는 David Blackman과 Sebastiano Vigna가 "Scrambled Linear Pseudorandom Number Generators", ACM Trans. Math. Softw., 2021에서 설명한 빠른 의사 난수 생성기입니다. 참조 구현은 https://prng.di.unimi.it 에서 사용할 수 있습니다.

높은 속도 외에도 Xoshiro는 메모리 사용량이 적어 오랜 시간 동안 여러 다른 난수 상태를 유지해야 하는 애플리케이션에 적합합니다.

Julia의 Xoshiro 구현은 대량 생성 모드를 가지고 있습니다. 이 모드는 부모로부터 새로운 가상 PRNG를 시드하고 SIMD를 사용하여 병렬로 생성합니다(즉, 대량 스트림은 여러 개의 교차된 xoshiro 인스턴스로 구성됩니다). 가상 PRNG는 대량 요청이 처리되면 폐기되며(힙 할당을 유발하지 않아야 함) 됩니다.

시드가 제공되지 않으면 시스템의 엔트로피를 사용하여 무작위로 생성된 시드가 생성됩니다. 이미 존재하는 Xoshiro 객체의 시드를 다시 설정하려면 seed! 함수를 참조하십시오.

Julia 1.11

음수 정수 시드를 전달하려면 최소한 Julia 1.11이 필요합니다.

예제

julia> using Random

julia> rng = Xoshiro(1234);

julia> x1 = rand(rng, 2)
2-element Vector{Float64}:
 0.32597672886359486
 0.5490511363155669

julia> rng = Xoshiro(1234);

julia> x2 = rand(rng, 2)
2-element Vector{Float64}:
 0.32597672886359486
 0.5490511363155669

julia> x1 == x2
true

source

Random.MersenneTwister — Type

MersenneTwister(seed)
MersenneTwister()

MersenneTwister RNG 객체를 생성합니다. 서로 다른 RNG 객체는 고유한 시드를 가질 수 있으며, 이는 서로 다른 난수 스트림을 생성하는 데 유용할 수 있습니다. seed는 정수, 문자열 또는 UInt32 정수의 벡터일 수 있습니다. 시드가 제공되지 않으면 무작위로 생성된 시드가 생성됩니다(시스템의 엔트로피를 사용하여). 이미 존재하는 MersenneTwister 객체의 시드를 다시 설정하려면 seed! 함수를 참조하십시오.

Julia 1.11

음수 정수 시드를 전달하려면 최소한 Julia 1.11이 필요합니다.

예제

julia> rng = MersenneTwister(123);

julia> x1 = rand(rng, 2)
2-element Vector{Float64}:
 0.37453777969575874
 0.8735343642013971

julia> x2 = rand(MersenneTwister(123), 2)
2-element Vector{Float64}:
 0.37453777969575874
 0.8735343642013971

julia> x1 == x2
true

source

Random.RandomDevice — Type

RandomDevice()

RandomDevice RNG 객체를 생성합니다. 이러한 두 객체는 항상 서로 다른 난수 스트림을 생성합니다. 엔트로피는 운영 체제에서 얻습니다.

source

Hooking into the `Random` API

Random 기능을 확장하는 주로 두 가지 직교적인 방법이 있습니다:

사용자 정의 유형의 임의 값 생성
새로운 생성기 만들기

1)의 API는 꽤 기능적이지만, 비교적 최근에 도입되었기 때문에 Random 모듈의 후속 릴리스에서 여전히 발전해야 할 수 있습니다. 예를 들어, 일반적으로 모든 다른 일반적인 메서드가 자동으로 작동하도록 하려면 하나의 rand 메서드를 구현하는 것으로 충분합니다.

2)의 API는 여전히 기본적이며, 일반적으로 생성된 값의 유형을 지원하기 위해 구현자가 필요 이상으로 더 많은 작업을 요구할 수 있습니다.

Generating random values of custom types

무작위 값을 생성하는 것은 다양한 분포에 대해 여러 가지 트레이드오프를 수반할 수 있습니다. 미리 계산된 값, 예를 들어 이산 분포를 위한 alias table 또는 단변량 분포를 위한 “squeezing” functions는 샘플링 속도를 상당히 높일 수 있습니다. 미리 계산해야 할 정보의 양은 우리가 분포에서 추출할 값의 수에 따라 달라질 수 있습니다. 또한, 일부 난수 생성기는 다양한 알고리즘이 활용하고자 할 수 있는 특정 속성을 가질 수 있습니다.

Random 모듈은 이러한 문제를 해결할 수 있는 무작위 값을 얻기 위한 사용자 정의 가능한 프레임워크를 정의합니다. rand의 각 호출은 위의 트레이드오프를 염두에 두고 사용자 정의할 수 있는 샘플러를 생성하며, 이는 Sampler에 메서드를 추가함으로써 이루어집니다. Sampler는 무작위 수 생성기, 분포를 특징짓는 객체, 반복 횟수에 대한 제안을 기반으로 분배할 수 있습니다. 현재 후자의 경우, Val{1}(단일 샘플용)과 Val{Inf}(임의의 수용)를 사용하며, Random.Repetition은 두 가지 모두에 대한 별칭입니다.

Sampler가 반환하는 객체는 무작위 값을 생성하는 데 사용됩니다. 샘플링할 수 있는 값 X에 대한 무작위 생성 인터페이스를 구현할 때, 구현자는 다음 메서드를 정의해야 합니다.

rand(rng, sampler)

특정 sampler는 Sampler(rng, X, repetition)에 의해 반환됩니다.

샘플러는 rand(rng, sampler)를 구현하는 임의의 값일 수 있지만, 대부분의 애플리케이션에서는 다음과 같은 미리 정의된 샘플러가 충분할 수 있습니다:

SamplerType{T}()는 타입 T에서 샘플을 추출하는 샘플러를 구현하는 데 사용할 수 있습니다 (예: rand(Int)). 이것은 타입에 대해 Sampler가 반환하는 기본값입니다.
SamplerTrivial(self)는 self에 대한 간단한 래퍼로, []를 사용하여 접근할 수 있습니다. 이는 사전 계산된 정보가 필요하지 않을 때(예: rand(1:3)) 권장되는 샘플러이며, 값에 대해 Sampler가 반환하는 기본값입니다.
SamplerSimple(self, data)는 또한 임의의 미리 계산된 값을 저장하는 데 사용할 수 있는 추가 data 필드를 포함하고 있으며, 이는 Sampler의 사용자 정의 메서드에서 계산되어야 합니다.

각각에 대한 예제를 제공합니다. 여기서는 알고리즘의 선택이 RNG와 독립적이라고 가정하므로, 서명에서 AbstractRNG를 사용합니다.

Random.Sampler — Type

Sampler(rng, x, repetition = Val(Inf))

rng에서 x의 무작위 값을 생성하는 데 사용할 수 있는 샘플러 객체를 반환합니다.

sp = Sampler(rng, x, repetition)일 때, rand(rng, sp)는 무작위 값을 추출하는 데 사용되며, 그에 따라 정의되어야 합니다.

repetition은 Val(1) 또는 Val(Inf)일 수 있으며, 해당하는 경우 사전 계산의 양을 결정하는 제안으로 사용되어야 합니다.

Random.SamplerType 및 Random.SamplerTrivial는 각각 타입 및 값에 대한 기본 대체입니다. Random.SamplerSimple는 이 목적만을 위해 추가 타입을 정의하지 않고도 사전 계산된 값을 저장하는 데 사용할 수 있습니다.

source

Random.SamplerType — Type

SamplerType{T}()

타입을 위한 샘플러로, 다른 정보는 포함되어 있지 않습니다. 타입으로 호출될 때 Sampler의 기본 대체입니다.

source

Random.SamplerTrivial — Type

SamplerTrivial(x)

주어진 값 x를 단순히 감싸는 샘플러를 생성합니다. 이는 값에 대한 기본 대체입니다. 이 샘플러의 eltype은 eltype(x)와 같습니다.

권장 사용 사례는 미리 계산된 데이터 없이 값에서 샘플링하는 것입니다.

source

Random.SamplerSimple — Type

SamplerSimple(x, data)

주어진 값 x와 data를 감싸는 샘플러를 생성합니다. 이 샘플러의 eltype은 eltype(x)와 같습니다.

권장 사용 사례는 미리 계산된 데이터로부터 값을 샘플링하는 것입니다.

source

사전 계산을 실제 값 생성과 분리하는 것은 API의 일부이며, 사용자에게도 제공됩니다. 예를 들어, rand(rng, 1:20)를 루프에서 반복적으로 호출해야 한다고 가정해 보겠습니다. 이 분리를 활용하는 방법은 다음과 같습니다:

rng = Xoshiro()
sp = Random.Sampler(rng, 1:20) # or Random.Sampler(Xoshiro, 1:20)
for x in X
    n = rand(rng, sp) # similar to n = rand(rng, 1:20)
    # use n
end

이것은 표준 라이브러리에서도 사용되는 메커니즘으로, 예를 들어 기본 구현인 랜덤 배열 생성(rand(1:20, 10)와 같은)에서 사용됩니다.

Generating values from a type

주어진 타입 T에 대해, 현재 rand(T)가 정의되어 있다면 타입 T의 객체가 생성될 것이라고 가정합니다. SamplerType은 타입에 대한 기본 샘플러입니다. 타입 T의 값의 무작위 생성을 정의하기 위해서는 rand(rng::AbstractRNG, ::Random.SamplerType{T}) 메서드를 정의해야 하며, 이 메서드는 rand(rng, T)가 반환할 것으로 예상되는 값을 반환해야 합니다.

다음 예를 들어 보겠습니다: 우리는 1부터 n까지 번호가 매겨진 가변적인 면의 수 n을 가진 Die 타입을 구현합니다. 우리는 rand(Die)가 최소 4면에서 최대 20면까지의 무작위 수를 가진 Die를 생성하기를 원합니다.

struct Die
    nsides::Int # number of sides
end

Random.rand(rng::AbstractRNG, ::Random.SamplerType{Die}) = Die(rand(rng, 4:20))

# output

Die의 스칼라 및 배열 메서드가 이제 예상대로 작동합니다:

julia> rand(Die)
Die(5)

julia> rand(Xoshiro(0), Die)
Die(10)

julia> rand(Die, 3)
3-element Vector{Die}:
 Die(9)
 Die(15)
 Die(14)

julia> a = Vector{Die}(undef, 3); rand!(a)
3-element Vector{Die}:
 Die(19)
 Die(7)
 Die(17)

A simple sampler without pre-computed data

여기에서 우리는 컬렉션에 대한 샘플러를 정의합니다. 사전 계산된 데이터가 필요하지 않은 경우, 실제로는 값에 대한 기본 대체인 SamplerTrivial 샘플러로 구현할 수 있습니다.

S 유형의 객체에서 무작위 생성을 정의하기 위해 다음과 같은 메서드를 정의해야 합니다: rand(rng::AbstractRNG, sp::Random.SamplerTrivial{S}). 여기서 sp는 단순히 S 유형의 객체를 래핑하며, sp[]를 통해 접근할 수 있습니다. Die 예제를 계속해서, 이제 rand(d::Die)를 정의하여 d의 면 중 하나에 해당하는 Int를 생성하고자 합니다:

julia> Random.rand(rng::AbstractRNG, d::Random.SamplerTrivial{Die}) = rand(rng, 1:d[].nsides);

julia> rand(Die(4))
1

julia> rand(Die(4), 3)
3-element Vector{Any}:
 2
 3
 3

주어진 컬렉션 타입 S에 대해, 현재 rand(::S)가 정의되어 있다면 eltype(S) 타입의 객체가 생성될 것이라고 가정하고 있습니다. 마지막 예제에서는 Vector{Any}가 생성되었는데, 그 이유는 eltype(Die) == Any이기 때문입니다. 해결책은 Base.eltype(::Type{Die}) = Int를 정의하는 것입니다.

Generating values for an `AbstractFloat` type

AbstractFloat 유형은 특별한 경우로 처리됩니다. 기본적으로 무작위 값은 전체 유형 도메인에서 생성되지 않고, 대신 [0,1) 범위에서 생성됩니다. 다음 메서드는 T <: AbstractFloat에 대해 구현되어야 합니다: Random.rand(::AbstractRNG, ::Random.SamplerTrivial{Random.CloseOpen01{T}})

An optimized sampler with pre-computed data

이산 분포를 고려해 보십시오. 여기서 숫자 1:n은 합이 1이 되는 주어진 확률로 추출됩니다. 이 분포에서 많은 값을 필요로 할 때 가장 빠른 방법은 alias table를 사용하는 것입니다. 여기서는 그러한 테이블을 구축하는 알고리즘을 제공하지 않지만, 대신 make_alias_table(probabilities)에서 사용할 수 있다고 가정하고, draw_number(rng, alias_table)를 사용하여 그로부터 무작위 숫자를 추출할 수 있습니다.

분포가 다음과 같이 설명된다고 가정해 보겠습니다.

struct DiscreteDistribution{V <: AbstractVector}
    probabilities::V
end

그리고 우리는 필요한 값의 수에 관계없이 항상 별칭 테이블을 구축하고자 합니다(아래에서 이를 사용자 정의하는 방법을 배웁니다). 방법들

Random.eltype(::Type{<:DiscreteDistribution}) = Int

function Random.Sampler(::Type{<:AbstractRNG}, distribution::DiscreteDistribution, ::Repetition)
    SamplerSimple(distribution, make_alias_table(distribution.probabilities))
end

샘플러를 반환하도록 정의되어야 하며, 미리 계산된 데이터를 사용해야 합니다.

function rand(rng::AbstractRNG, sp::SamplerSimple{<:DiscreteDistribution})
    draw_number(rng, sp.data)
end

값을 그리는 데 사용됩니다.

Custom sampler types

SamplerSimple 유형은 미리 계산된 데이터와 함께 대부분의 사용 사례에 충분합니다. 그러나 사용자 정의 샘플러 유형을 사용하는 방법을 보여주기 위해 여기에서 SamplerSimple과 유사한 것을 구현합니다.

우리의 Die 예제로 돌아가면: rand(::Die)는 범위에서 무작위 생성을 사용하므로 이 최적화를 위한 기회가 있습니다. 우리는 우리의 사용자 정의 샘플러를 SamplerDie라고 부릅니다.

import Random: Sampler, rand

struct SamplerDie <: Sampler{Int} # generates values of type Int
    die::Die
    sp::Sampler{Int} # this is an abstract type, so this could be improved
end

Sampler(RNG::Type{<:AbstractRNG}, die::Die, r::Random.Repetition) =
    SamplerDie(die, Sampler(RNG, 1:die.nsides, r))
# the `r` parameter will be explained later on

rand(rng::AbstractRNG, sp::SamplerDie) = rand(rng, sp.sp)

이제 sp = Sampler(rng, die)로 샘플러를 얻을 수 있으며, rng와 관련된 모든 rand 호출에서 die 대신 sp를 사용할 수 있습니다. 위의 단순한 예에서 die는 SamplerDie에 저장할 필요가 없지만, 실제로는 종종 그런 경우가 많습니다.

물론, 이 패턴은 매우 빈번하게 발생하므로 위에서 사용된 헬퍼 타입인 Random.SamplerSimple이 제공되어 SamplerDie의 정의를 생략할 수 있습니다: 우리는 다음과 같이 우리의 분리를 구현할 수 있었습니다:

Sampler(RNG::Type{<:AbstractRNG}, die::Die, r::Random.Repetition) =
    SamplerSimple(die, Sampler(RNG, 1:die.nsides, r))

rand(rng::AbstractRNG, sp::SamplerSimple{Die}) = rand(rng, sp.data)

여기서 sp.data는 SamplerSimple 생성자 호출의 두 번째 매개변수를 나타내며(이 경우 Sampler(rng, 1:die.nsides, r)와 같습니다), Die 객체는 sp[]를 통해 접근할 수 있습니다.

SamplerDie와 마찬가지로, 모든 사용자 정의 샘플러는 Sampler{T}의 하위 유형이어야 하며, 여기서 T는 생성된 값의 유형입니다. SamplerSimple(x, data) isa Sampler{eltype(x)}임을 주목하세요. 따라서 이는 SamplerSimple의 첫 번째 인수가 무엇일 수 있는지를 제한합니다(샘플러 메서드를 정의할 때 x가 단순히 전달되는 Die 예제와 같이 SamplerSimple을 사용하는 것이 권장됩니다). 유사하게, SamplerTrivial(x) isa Sampler{eltype(x)}입니다.

다른 경우에 사용할 수 있는 또 다른 헬퍼 유형은 Random.SamplerTag이며, 내부 API로 간주되며 적절한 사용 중단 없이 언제든지 중단될 수 있습니다.

Using distinct algorithms for scalar or array generation

일부 경우, 소수의 값만 생성할지 또는 많은 값을 생성할지를 선택하는 것이 알고리즘 선택에 영향을 미칠 수 있습니다. 이는 Sampler 생성자의 세 번째 매개변수로 처리됩니다. Die에 대해 두 개의 도우미 유형을 정의했다고 가정해 보겠습니다. SamplerDie1은 소수의 무작위 값을 생성하는 데 사용해야 하고, SamplerDieMany는 많은 값을 생성하는 데 사용해야 합니다. 이러한 유형을 다음과 같이 사용할 수 있습니다:

Sampler(RNG::Type{<:AbstractRNG}, die::Die, ::Val{1}) = SamplerDie1(...)
Sampler(RNG::Type{<:AbstractRNG}, die::Die, ::Val{Inf}) = SamplerDieMany(...)

물론, rand는 이러한 타입에서도 정의되어야 합니다 (즉, rand(::AbstractRNG, ::SamplerDie1) 및 rand(::AbstractRNG, ::SamplerDieMany)). 일반적으로 SamplerTrivial 및 SamplerSimple는 사용자 정의 타입이 필요하지 않은 경우 사용할 수 있습니다.

참고: Sampler(rng, x)는 단순히 Sampler(rng, x, Val(Inf))의 약어이며, Random.Repetition은 Union{Val{1}, Val{Inf}}의 별칭입니다.

Creating new generators

API는 아직 명확하게 정의되지 않았지만, 일반적인 규칙으로:

특정 RNG에 대해 필요한 경우, "기본" 유형(isbitstype 정수 및 부동 소수점 유형)으로 생성되는 모든 rand 메서드는 정의되어야 합니다;
다른 문서화된 rand 메서드는 AbstractRNG를 받아들이며, (1)에서 의존하는 메서드가 구현되어 있다면 즉시 작동해야 합니다. 그러나 최적화를 위한 여지가 있다면 이 RNG에 맞게 특수화할 수 있습니다.
copy는 의사 난수 생성기(pseudo-RNG)에 대해 호출된 시점부터 원본과 정확히 동일한 난수 시퀀스를 생성하는 독립적인 복사본을 반환해야 합니다. 이것이 불가능한 경우(예: 하드웨어 기반 난수 생성기), copy는 구현되어서는 안 됩니다.

Concerning 1), a rand method may happen to work automatically, but it's not officially supported and may break without warnings in a subsequent release.

새로운 rand 메서드를 가상의 MyRNG 생성기와 값 사양 s (예: s == Int 또는 s == 1:10)에 대해 정의하려면, S==typeof(s) 또는 S==Type{s} (만약 s가 타입인 경우)와 같은 두 가지 메서드를 이전에 보았던 것처럼 정의해야 합니다:

Sampler(::Type{MyRNG}, ::S, ::Repetition)은 SamplerS와 같은 유형의 객체를 반환합니다.
rand(rng::MyRNG, sp::SamplerS)

Sampler(rng::AbstractRNG, ::S, ::Repetition)가 Random 모듈에 이미 정의되어 있을 수 있습니다. 이 경우, 특정 RNG 유형에 대한 생성을 전문화하려는 경우 실제로 1단계를 건너뛸 수 있지만, 해당 SamplerS 유형은 내부 세부 사항으로 간주되며, 경고 없이 변경될 수 있습니다.

Specializing array generation

일부 경우, 특정 RNG 유형에 대해 무작위 값 배열을 생성하는 것이 이전에 설명한 분리 기법을 단순히 사용하는 것보다 특수화된 방법으로 더 효율적일 수 있습니다. 예를 들어, MersenneTwister의 경우, 무작위 값을 배열에 원래대로 작성합니다.

MyRNG에 대한 이 특수화를 구현하고 s라는 사양에 대해 S 유형의 요소를 생성하기 위해 다음과 같은 메서드를 정의할 수 있습니다: rand!(rng::MyRNG, a::AbstractArray{S}, ::SamplerS), 여기서 SamplerS는 Sampler(MyRNG, s, Val(Inf))에 의해 반환되는 샘플러의 유형입니다. AbstractArray 대신, 기능을 Array{S}와 같은 하위 유형에 대해서만 구현할 수 있습니다. rand의 비변이 배열 메서드는 내부적으로 이 특수화를 자동으로 호출합니다.

Reproducibility

주어진 시드로 초기화된 RNG 매개변수를 사용하면 프로그램을 여러 번 실행할 때 동일한 의사 난수 시퀀스를 재현할 수 있습니다. 그러나 Julia의 소규모 릴리스(예: 1.3에서 1.4로)에서는 특정 시드에서 생성된 의사 난수 시퀀스가 변경될 수 있습니다. 특히 MersenneTwister가 사용되는 경우에 그렇습니다. (저수준 함수인 rand가 생성하는 시퀀스가 변경되지 않더라도, 고수준 함수인 randsubseq의 출력은 알고리즘 업데이트로 인해 변경될 수 있습니다.) 이유: 의사 난수 스트림이 절대 변경되지 않도록 보장하는 것은 많은 알고리즘 개선을 금지합니다.

무작위 데이터의 정확한 재현성을 보장해야 하는 경우, 데이터를 저장하는 것이 좋습니다(예: 과학 출판물의 보조 첨부 파일로). (물론 특정 Julia 버전과 패키지 매니페스트를 지정할 수도 있으며, 특히 비트 재현성이 필요한 경우에는 더욱 그렇습니다.)

특정 "무작위" 데이터에 의존하는 소프트웨어 테스트는 일반적으로 데이터를 저장하거나 테스트 코드에 포함시키거나 StableRNGs.jl와 같은 서드파티 패키지를 사용해야 합니다. 반면, 대부분의 무작위 데이터에 대해 통과해야 하는 테스트(예: 무작위 행렬 A = randn(n,n)에 대해 A \ (A*x) ≈ x 테스트)는 고정된 시드를 가진 RNG를 사용하여 테스트를 여러 번 실행해도 매우 불확실한 데이터(예: 극도로 잘못된 조건의 행렬)로 인해 실패하지 않도록 할 수 있습니다.

무작위 샘플이 추출되는 통계적 분포는 모든 사소한 줄리아 릴리스에서 동일할 것이라고 보장됩니다.