activations_1
Activation Function μ΄λ?
Activation Function(νμ±ν ν¨μ)μ μΈκ³΅μ κ²½λ§μμ μ λ ₯ μ νΈλ₯Ό μ²λ¦¬ν ν, μΆλ ₯ μ νΈλ₯Ό λ§λ€μ΄λ΄λ ν¨μμ λλ€. μ¦, μ λ ₯κ°μ λν κ²°κ³Όκ°μ κ²°μ νλ ν¨μμ λλ€.
νμ±ν ν¨μλ λΉμ ν ν¨μ(non-linear function)μ΄μ΄μΌ ν©λλ€. μ΄λ μΈκ³΅μ κ²½λ§μ΄ 볡μ‘ν λ°μ΄ν°λ₯Ό μ²λ¦¬νκ³ , λ€μν ν¨ν΄μ νμ΅ν μ μλλ‘ νκΈ° μν¨μ λλ€. λ§μ½ νμ±ν ν¨μκ° μ ν ν¨μ(linear function)μ΄λΌλ©΄, μ κ²½λ§μ΄ κΉμ΄μ§μλ‘ μ λ ₯κ°κ³Ό μΆλ ₯κ°μ΄ μ νμ μΈ κ΄κ³λ₯Ό κ°κ² λμ΄, ν¨κ³Όμ μΈ νμ΅μ΄ λΆκ°λ₯ν΄μ§λλ€.
λνμ μΈ νμ±ν ν¨μλ‘λ μκ·Έλͺ¨μ΄λ ν¨μ, ReLU ν¨μ, tanh ν¨μ λ±μ΄ μμ΅λλ€. μ΄λ¬ν νμ±ν ν¨μλ μ λ ₯κ°μ λν΄ λ€μν λ³νλ₯Ό μ£Όμ΄, μ κ²½λ§μ΄ 볡μ‘ν ν¨ν΄μ νμ΅ν μ μλλ‘ ν©λλ€.
νμ±ν ν¨μμ μ’ λ₯λ₯Ό μ μνλ μ΄κ±°ν(enum)μ λλ€.
κ°κ°μ νμ±ν ν¨μλ ν΄λΉ ν¨μμ νΉμ±μ λ°λΌ μ νλμ΄ μ¬μ©λ©λλ€. μ΄λ¬ν νμ±ν ν¨μλ€μ λ€μν λΉμ νμ±(non-linearity)μ κ°μ§κ³ μκΈ° λλ¬Έμ, μΈκ³΅μ κ²½λ§ λͺ¨λΈμ΄ 볡μ‘ν ν¨ν΄μ νμ΅ν μ μλλ‘ λμ΅λλ€.
κ° νμ±ν ν¨μμ νΉμ§μ λ€μκ³Ό κ°μ΅λλ€.
LOGISTIC : λ‘μ§μ€ν± ν¨μ
RELU : ReLU ν¨μ
RELIE : ReLU ν¨μμ λ³ν
LINEAR : μ ν ν¨μ
RAMP : RAMP ν¨μ
TANH : νμ΄νΌλ³Όλ¦ νμ νΈ ν¨μ
PLSE : ν립-μ ν ν¨μ
LEAKY : Leaky ReLU ν¨μ
ELU : Exponential Linear Units ν¨μ
LOGGY : λ‘μ§μ€ν± ν¨μμ λ³ν
STAIR : κ³λ¨ ν¨μ
HARDTAN : νλ νμ νΈ ν¨μ
LHTAN : LeCun νμ΄νΌλ³Όλ¦ νμ νΈ ν¨μ
SELU : Scaled Exponential Linear Units ν¨μ
μ΄λ¬ν νμ±ν ν¨μλ€μ λͺ¨λΈμ μ λ ₯κ°μ λν΄ μ ν©ν λΉμ ν λ³νμ μννμ¬, λͺ¨λΈμ΄ μ λ ₯ λ°μ΄ν°μ ν¨ν΄μ νμ νκ³ μμΈ‘μ μνν μ μλλ‘ ν©λλ€.
get_activation_string
ν¨μ μ΄λ¦: get_activation_string
μ λ ₯:
a: νμ±ν ν¨μ(enum κ°)
λμ:
μ λ ₯λ νμ±ν ν¨μ(enum κ°)μ λμλλ λ¬Έμμ΄μ λ°νν©λλ€.
μ€λͺ :
μ΄ ν¨μλ νμ±ν ν¨μλ₯Ό μ λ ₯νλ©΄ ν΄λΉ ν¨μμ λμλλ λ¬Έμμ΄μ λ°νν©λλ€.
λ¬Έμμ΄μ ν΄λΉ ν¨μμ μ΄λ¦κ³Ό λμΌν©λλ€.
λ§μ½ μ λ ₯λ ν¨μμ λμνλ λ¬Έμμ΄μ΄ μλ κ²½μ°, κΈ°λ³Έκ°μΌλ‘ "relu"λ₯Ό λ°νν©λλ€.
get_activation
ν¨μ μ΄λ¦: get_activation
μ λ ₯:
s: νμ±ν ν¨μλ₯Ό λνλ΄λ λ¬Έμμ΄
λμ:
μ λ ₯λ λ¬Έμμ΄μ λμνλ νμ±ν ν¨μ(enum κ°)μ λ°νν©λλ€.
μ€λͺ :
μ΄ ν¨μλ λ¬Έμμ΄λ‘ ννλ νμ±ν ν¨μμ μ΄λ¦μ μ λ ₯νλ©΄ ν΄λΉ ν¨μμ λμνλ enum κ°(μ μ)μ λ°νν©λλ€.
ν¨μ λ΄λΆμμλ μ λ ₯λ λ¬Έμμ΄μ νμ±ν ν¨μ μ΄λ¦λ€κ³Ό λΉκ΅νμ¬ λμνλ enum κ°μ λ°ννλ©°, μ λ ₯λ λ¬Έμμ΄μ΄ μ΄λ ν νμ±ν ν¨μμλ λμλμ§ μλ κ²½μ°μλ κΈ°λ³Έκ°μΌλ‘ RELUλ₯Ό λ°νν©λλ€.
μ΄ λ, ν¨μλ stderrμ μ΄μ©νμ¬ μλ¬ λ©μμ§λ₯Ό μΆλ ₯ν©λλ€.
activate
ν¨μ μ΄λ¦: activate
μ λ ₯:
x: νμ±ν ν¨μμ λν μ λ ₯ κ°
a: μ μ©ν νμ±ν ν¨μ
λμ:
μ λ ₯λ νμ±ν ν¨μ(enum κ°)μ λ°λΌ x κ°μ νμ±νν©λλ€.
μ€λͺ :
μ΄ ν¨μλ μ λ ₯λ μ€μκ° xμ νμ±ν ν¨μ(enum κ°)μ μ λ ₯λ°μ, ν΄λΉ νμ±ν ν¨μμ λ°λΌ x κ°μ νμ±νν©λλ€. μ΄ ν¨μλ float ν κ°μ λ°νν©λλ€.
νμ±ν ν¨μλ μ ν(linear), λ‘μ§μ€ν±(logistic), λ‘κ·Έ(loggy), ReLU(relu), ELU(elu), SELU(selu), RELIE(relie), RAMP(ramp), LeakyReLU(leaky), νμ΄νΌλ³Όλ¦ νμ νΈ(tanh), PLSE(plse), STAIR(stair), HardTanh(hardtan), LHTan(lhtan) λ±μ΄ κ°λ₯ν©λλ€.
ν΄λΉ ν¨μλ μ λ ₯λ νμ±ν ν¨μ(enum κ°)μ λ°λΌ μ μ ν νμ±ν ν¨μλ₯Ό νΈμΆνμ¬ μ€μκ° xλ₯Ό μ²λ¦¬νκ³ κ²°κ³Όλ₯Ό λ°νν©λλ€.
activate_array
ν¨μ μ΄λ¦: activate_array
μ λ ₯:
x: μ λ ₯κ° λ°°μ΄
n: λ°°μ΄ ν¬κΈ°
a: νμ±ν ν¨μ
λμ:
μ λ ₯κ° λ°°μ΄ xμ νμ±ν ν¨μ aλ₯Ό μ μ©νμ¬ κ° μμλ₯Ό νμ±νν©λλ€.
μ€λͺ :
μ΄ ν¨μλ μ λ ₯κ° λ°°μ΄ xμ κ° μμμ νμ±ν ν¨μ aλ₯Ό μ μ©ν©λλ€.
μ λ ₯κ° λ°°μ΄ xμ λ°°μ΄ ν¬κΈ° n, κ·Έλ¦¬κ³ νμ±ν ν¨μ aλ₯Ό μ λ ₯μΌλ‘ λ°μ΅λλ€.
λ°°μ΄ xμ κ° μμμ λν΄ activate ν¨μλ₯Ό νΈμΆνμ¬ νμ±νλ κ°μ λ€μ λ°°μ΄ xμ ν΄λΉ μμμ μ μ₯ν©λλ€.
μ΄ κ³Όμ μ λ°°μ΄ xμ λͺ¨λ μμμ λν΄ λ°λ³΅νλ©΄, μ λ ₯κ° λ°°μ΄ xμ νμ±ν ν¨μ aλ₯Ό μ μ©ν κ²°κ³Όλ₯Ό μ»μ μ μμ΅λλ€.
gradient
ν¨μ μ΄λ¦: gradient
μ λ ₯:
x: νμ±ν ν¨μμ λν μ λ ₯ κ°
a: μ μ©ν νμ±ν ν¨μ
λμ:
μ λ ₯ κ° xμ μ μ©ν νμ±ν ν¨μ aμ λ°λΌ ν΄λΉ νμ±ν ν¨μμ λν¨μλ₯Ό κ³μ°νμ¬ λ°ννλ ν¨μ
μ€λͺ :
μ κ²½λ§μμ μμ ν(backpropagation) μκ³ λ¦¬μ¦μ μ μ©ν λ, μ€μ°¨(error)λ₯Ό μ΅μννκΈ° μν΄ κ°μ€μΉ(weight)λ₯Ό μ‘°μ ν΄μΌ νλλ°, μ΄λ₯Ό μν΄ κ° λ Έλμ μ λ ₯ κ°μ΄ νμ±ν ν¨μλ₯Ό κ±°μ³ μΆλ ₯ κ°μΌλ‘ λ³νλλ κ³Όμ μμ ν΄λΉ νμ±ν ν¨μμ λν¨μ(gradient)λ₯Ό ꡬν΄μΌ νλ€.
gradient ν¨μλ μ λ ₯ κ° xμ μ μ©ν νμ±ν ν¨μ aλ₯Ό λ°μ ν΄λΉ νμ±ν ν¨μμ λν¨μλ₯Ό κ³μ°νμ¬ λ°ννλ ν¨μλ‘, switchλ¬Έμ μ¬μ©νμ¬ μ λ ₯μΌλ‘ λ°μ νμ±ν ν¨μ aμ λ°λΌ ν΄λΉ λν¨μλ₯Ό κ³μ°νμ¬ λ°ννλ€.
gradient_array
ν¨μ μ΄λ¦: gradient_array
μ λ ₯:
x: μ λ ₯ λ°°μ΄ ν¬μΈν°
n: μ λ ₯ λ°°μ΄μ ν¬κΈ°
a: νμ±ν ν¨μ
delta: μΆλ ₯ λ°°μ΄ ν¬μΈν°
λμ:
μ λ ₯ λ°°μ΄ xμ κ° μμμ λν νμ±ν ν¨μμ λ―ΈλΆ κ°μ deltaμ κ³±νμ¬ μΆλ ₯ λ°°μ΄μ κ³μ°νλ€.
μ΄ ν¨μλ μμ ν(backpropagation) μκ³ λ¦¬μ¦μμ μ¬μ©λλ©°, λ―ΈλΆ κ°(delta)μ μ λ ₯μΌλ‘ λ°μ, μ΄μ μΈ΅μμ μ λ¬λ λ―ΈλΆ κ°μ λν νμ¬ μΈ΅μ λ―ΈλΆ κ°μ κ³μ°νμ¬ μ΄μ μΈ΅μΌλ‘ μ λ¬νλ μν μ νλ€.
μ€λͺ :
μμ ν μκ³ λ¦¬μ¦μ λ₯λ¬λ νμ΅μμ μ¬μ©λλ κΈ°λ²μΌλ‘, μΆλ ₯ κ°κ³Ό μ€μ κ° μ¬μ΄μ μ€μ°¨λ₯Ό μ΅μννλ λ°©ν₯μΌλ‘ κ°μ€μΉμ νΈν₯μ μ λ°μ΄νΈνλ€.
μ΄ κ³Όμ μμ gradient_array ν¨μλ κ° μΈ΅μμ κ³μ°λ λ―ΈλΆ κ°κ³Ό νμ±ν ν¨μμ λ―ΈλΆ κ°μ κ³±νμ¬ μ΄μ μΈ΅μΌλ‘ μ λ¬νλ©°, μ΄μ μΈ΅μμ μ λ¬λ λ―ΈλΆ κ°μ νμ¬ μΈ΅μμ κ³±νμ¬ μΆλ ₯ λ°°μ΄μ λ―ΈλΆ κ°μ κ³μ°νλ€. μ΄λ κ² κ³μ°λ λ―ΈλΆ κ°μ κ°μ€μΉμ νΈν₯μ μ λ°μ΄νΈν λ μ¬μ©λλ€.
Last updated
Was this helpful?