cost_layer
Loss๋ฅผ ๊ตฌํ๊ธฐ ์ํ layer์ ๋๋ค.
COST_TYPE
์ ์ฝ๋๋ COST_TYPE๋ผ๋ ์ด๊ฑฐํ(enum)์ ์ ์ํ๋ ์ฝ๋์ ๋๋ค. COST_TYPE์ ๋คํธ์ํฌ์ ์์ค ํจ์(loss function)๋ฅผ ์ง์ ํ๊ธฐ ์ํด ์ฌ์ฉ๋ฉ๋๋ค.
์ด ์ด๊ฑฐํ์ ๋ค์ฏ ๊ฐ์ง์ ์์(constant)๋ฅผ ์ ์ํ๊ณ ์์ต๋๋ค:
SSE : ํ๊ท ์ ๊ณฑ ์ค์ฐจ(Mean Squared Error, MSE) ์์ค ํจ์๋ฅผ ๋ํ๋ ๋๋ค. ์ค์ ๊ฐ๊ณผ ์์ธก ๊ฐ์ ์ฐจ์ด๋ฅผ ์ ๊ณฑํ ํ ๋ชจ๋ ์ ๋ ฅ์ ๋ํด ํ๊ท ์ ์ทจํ ๊ฐ์ผ๋ก, ์์ธก์ด ์ ํํ ์๋ก ๊ฐ์ด ์์์ง๋๋ค.
MASKED : ๋ง์คํฌ(mask)๋ฅผ ์ ์ฉํ ํ๊ท ์ ๊ณฑ ์ค์ฐจ ์์ค ํจ์์ ๋๋ค. ๋ง์คํฌ๋ ์ผ๋ถ ์ ๋ ฅ์ ๋ฌด์ํ๊ณ ์์ค์ ๊ณ์ฐํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
L1 : ์ ๋ ์ค์ฐจ(Absolute Error) ์์ค ํจ์๋ฅผ ๋ํ๋ ๋๋ค. ์ค์ ๊ฐ๊ณผ ์์ธก ๊ฐ์ ์ฐจ์ด์ ์ ๋๊ฐ์ ๋ํด ๋ชจ๋ ์ ๋ ฅ์ ๋ํด ํ๊ท ์ ์ทจํ ๊ฐ์ผ๋ก, ์์ธก์ด ์ ํํ ์๋ก ๊ฐ์ด ์์์ง๋๋ค.
SEG : ์ธ๊ทธ๋ฉํ ์ด์ (segmentation) ๋ฌธ์ ์ ์ฌ์ฉ๋๋ ๊ต์ฐจ ์ํธ๋กํผ(Cross-Entropy) ์์ค ํจ์์ ๋๋ค. ์ ๋ ฅ ์ด๋ฏธ์ง์ ๊ฐ ํฝ์ ์ด ํด๋์ค(class)์ ์ํ ํ๋ฅ ์ ์์ธกํ๊ณ , ์ด ์์ธก ๊ฐ๊ณผ ์ค์ ํด๋์ค ๊ฐ์ ์ฐจ์ด์ ๋ํด ์์ค์ ๊ณ์ฐํฉ๋๋ค.
SMOOTH : ์ธ๊ทธ๋ฉํ ์ด์ ๋ฌธ์ ์ ์ฌ์ฉ๋๋ ์ค๋ฌด๋ฉ(smoothing)๋ ๊ต์ฐจ ์ํธ๋กํผ ์์ค ํจ์์ ๋๋ค. SEG์ ์ ์ฌํ์ง๋ง, ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ ๊ฐ์ ์ค์ฐจ๋ฅผ ํํํ(smoothing)ํ์ฌ ์ธ๊ทธ๋ฉํ ์ด์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ค ๋ถ๋๋ฝ๊ฒ ๋ง๋ญ๋๋ค.
WGAN : ์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง(Generative Adversarial Network, GAN)์์ ์ฌ์ฉ๋๋ ์์ค ํจ์์ธ Wasserstein GAN ์์ค ํจ์์ ๋๋ค. GAN์ ์ด๋ฏธ์ง ์์ฑ์ ํ์ฉ๋๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ก, WGAN ์์ค ํจ์๋ ์์ฑ๋ ์ด๋ฏธ์ง์ ์ค์ ์ด๋ฏธ์ง ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์ต์ํํ๋ ๋ฐฉ์์ผ๋ก ๋ชจ๋ธ์ ํ์ตํฉ๋๋ค.
get_cost_type
ํจ์ ์ด๋ฆ: get_cost_type
์ ๋ ฅ:
s: ๋ฌธ์์ด ํฌ์ธํฐ
๋์:
์ ๋ ฅ๋ ๋ฌธ์์ด s์ COST_TYPE ์ด๊ฑฐํ ์์๋ฅผ ๋น๊ตํ์ฌ ์ผ์นํ๋ COST_TYPE์ ๋ฐํํฉ๋๋ค.
์ ๋ ฅ๋ ๋ฌธ์์ด๊ณผ ์ผ์นํ๋ COST_TYPE์ด ์์ผ๋ฉด "Couldn't find cost type %s, going with SSE" ์ค๋ฅ ๋ฉ์์ง๋ฅผ ์ถ๋ ฅํ๊ณ SSE๋ฅผ ๋ฐํํฉ๋๋ค.
์ค๋ช :
get_cost_type ํจ์๋ ๋ฌธ์์ด s๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ์ด์ ๋์ํ๋ COST_TYPE์ ๋ฐํํฉ๋๋ค.
์ ๋ ฅ๋ ๋ฌธ์์ด s๋ฅผ SEG, SSE, MASKED, SMOOTH, L1, WGAN๊ณผ ์ฐจ๋ก๋๋ก ๋น๊ตํ๋ฉด์ ์ผ์นํ๋ COST_TYPE ์์๋ฅผ ๋ฐํํฉ๋๋ค.
์ผ์นํ๋ ๋ฌธ์์ด์ด ์์ ๊ฒฝ์ฐ fprintf ํจ์๋ฅผ ์ฌ์ฉํ์ฌ "Couldn't find cost type %s, going with SSE" ์ค๋ฅ ๋ฉ์์ง๋ฅผ ์ถ๋ ฅํ๊ณ SSE๋ฅผ ๋ฐํํฉ๋๋ค.
ํจ์๊ฐ ๋ฐํํ๋ ๊ฐ์ COST_TYPE ์ด๊ฑฐํ ์์์ ๋๋ค.
get_cost_string
ํจ์ ์ด๋ฆ: get_cost_string
์ ๋ ฅ:
a: COST_TYPE ํ์ ์ ๋ณ์
๋์:
a์ ํด๋นํ๋ COST_TYPE์ ๋ํ ๋ฌธ์์ด์ ๋ฐํํ๋ค.
์ค๋ช :
์ ๋ ฅ์ผ๋ก ๋ฐ์ COST_TYPE a์ ํด๋นํ๋ ๋ฌธ์์ด์ ๋ฐํํ๋ ํจ์์ด๋ค.
switch ๋ฌธ์ ์ฌ์ฉํ์ฌ a๊ฐ ๊ฐ๊ฐ์ COST_TYPE์ ํด๋นํ๋ ๊ฒฝ์ฐ์ ํด๋นํ๋ ๋ฌธ์์ด์ ๋ฐํํ๋ค.
๋ง์ฝ a๊ฐ ์ด๋ ํ COST_TYPE์๋ ํด๋นํ์ง ์๋ ๊ฒฝ์ฐ "sse" ๋ฌธ์์ด์ ๋ฐํํ๋ค.
forward_cost_layer
ํจ์ ์ด๋ฆ: forward_cost_layer
์ ๋ ฅ:
cost_layer l: ๋น์ฉ ๊ณ์ฐ ๋ ์ด์ด ๊ตฌ์กฐ์ฒด
network net: ์ ๊ฒฝ๋ง ๊ตฌ์กฐ์ฒด
๋์:
net.truth์ด ์กด์ฌํ๋ฉด ์คํ
l.cost_type์ด MASKED์ผ ๊ฒฝ์ฐ, SECRET_NUM์ผ๋ก ํ์๋ ๊ฐ์ด ์๋ ์์น๋ net.input ๊ฐ๋ SECRET_NUM์ผ๋ก ๋ณ๊ฒฝ
l.cost_type์ด SMOOTH์ผ ๊ฒฝ์ฐ, smooth L1 ํจ์๋ฅผ ์ด์ฉํ์ฌ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ์ฌ l.delta์ l.output์ ์ ์ฅ
l.cost_type์ด L1์ผ ๊ฒฝ์ฐ, L1 ํจ์๋ฅผ ์ด์ฉํ์ฌ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ์ฌ l.delta์ l.output์ ์ ์ฅ
l.cost_type์ด ๊ทธ ์ธ์ผ ๊ฒฝ์ฐ, L2 ํจ์๋ฅผ ์ด์ฉํ์ฌ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ์ฌ l.delta์ l.output์ ์ ์ฅ
l.output์ ๋ชจ๋ ์์์ ํฉ์ l.cost[0]์ ์ ์ฅ
์ค๋ช :
๋น์ฉ ๊ณ์ฐ ๋ ์ด์ด๋ ์ ๊ฒฝ๋ง์ ์์ธก ๊ฒฐ๊ณผ์ ์ค์ ๊ฒฐ๊ณผ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ์ฌ ๋น์ฉ์ ๊ตฌํ๋ ์ญํ ์ ํฉ๋๋ค.
์ด ํจ์๋ ์ฃผ์ด์ง ๋น์ฉ ๊ณ์ฐ ๋ ์ด์ด์ ์ ๊ฒฝ๋ง์ ์ด์ฉํ์ฌ ๋น์ฉ์ ๊ณ์ฐํ๊ณ , ๊ณ์ฐ๋ ๋น์ฉ์ l.cost[0]์ ์ ์ฅํฉ๋๋ค.
๋ํ, l.cost_type์ ๋ฐ๋ผ์ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ๋ ํจ์๋ฅผ ํธ์ถํ์ฌ l.delta์ l.output์ ์ ์ฅํฉ๋๋ค.
์ด๋, l.cost_type์ด MASKED์ผ ๊ฒฝ์ฐ, SECRET_NUM์ผ๋ก ํ์๋ ๊ฐ์ด ์๋ ์์น๋ net.input ๊ฐ๋ SECRET_NUM์ผ๋ก ๋ณ๊ฒฝํ์ฌ ๋น์ฉ ๊ณ์ฐ์์ ์ ์ธํฉ๋๋ค.
.
backward_cost_layer
ํจ์ ์ด๋ฆ: backward_cost_layer
์ ๋ ฅ:
cost_layer l
network net
๋์:
cost_layer์ gradient๋ฅผ ๊ณ์ฐํ๊ณ , ์ด๋ฅผ network์ delta๊ฐ์ ๋ํด์ค๋ค.
์ด ๋, l.scale์ gradient์ ํฌ๊ธฐ๋ฅผ ์ ์ดํ๊ธฐ ์ํ ์ค์ผ์ผ๋ง ์ธ์์ด๋ค.
์ค๋ช :
cost_layer์ gradient๋ delta ๋ฐฐ์ด์ ์ ์ฅ๋๋ค.
axpy_cpu ํจ์๋ฅผ ํตํด net.delta ๋ฐฐ์ด์ l.delta ๋ฐฐ์ด์ l.scale๋งํผ ์ค์ผ์ผ๋งํ์ฌ ๋ํด์ค๋ค.
์ด ๋, ๋ ๋ฐฐ์ด์ ํฌ๊ธฐ๋ l.batch*l.inputs์ด๋ค.
์ฆ, cost_layer๋ฅผ ํตํด ๊ตฌํ gradient๋ network์ ๋ค์ layer๋ก ์ ๋ฌ๋๋ฉฐ, ์ดํ์ backward propagation์ด ์ด์ด์ ธ์ gradient๊ฐ ์ญ์ ํ๋๊ฒ ๋๋ค.
resize_cost_layer
ํจ์ ์ด๋ฆ: resize_cost_layer
์ ๋ ฅ:
l: cost_layer ๊ตฌ์กฐ์ฒด ํฌ์ธํฐ
inputs: int
๋์:
cost_layer ๊ตฌ์กฐ์ฒด ํฌ์ธํฐ l์ inputs์ outputs ๋ฉค๋ฒ ๋ณ์๋ฅผ ์ ๋ ฅ๊ฐ์ผ๋ก ๋ณ๊ฒฝํ๊ณ , delta์ output ๋ฐฐ์ด์ ํฌ๊ธฐ๋ฅผ realloc ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ์ฌํ ๋นํ๋ค.
์ค๋ช :
ํจ์๋ cost_layer ๊ตฌ์กฐ์ฒด๋ฅผ ๋ฐ์์ ํด๋น ๊ตฌ์กฐ์ฒด์ ๋ฉค๋ฒ ๋ณ์๋ฅผ ์กฐ์ ํ๋ ์ญํ ์ ํ๋ค.
l์ inputs์ outputs ๋ฉค๋ฒ ๋ณ์๋ฅผ ์ ๋ ฅ๊ฐ์ผ๋ก ๋ณ๊ฒฝํ๋ค.
realloc ํจ์๋ฅผ ์ฌ์ฉํ์ฌ l->delta ๋ฐฐ์ด๊ณผ l->output ๋ฐฐ์ด์ ํฌ๊ธฐ๋ฅผ inputsl->batchsizeof(float)์ผ๋ก ์ฌํ ๋นํ๋ค.
์ด ํจ์๋ resize_network ํจ์์์ ํธ์ถ๋๋ฉฐ, ์ ๊ฒฝ๋ง์ ์ฌ์กฐ์ ํ ๋ cost_layer๋ ํจ๊ป ์กฐ์ ํด์ผ ํ๊ธฐ ๋๋ฌธ์ ํ์ํ๋ค.
make_cost_layer
ํจ์ ์ด๋ฆ: make_cost_layer
์ ๋ ฅ:
int batch: batch size
int inputs: layer์ input dimension
COST_TYPE cost_type: cost function type
float scale: cost์ ํฌ๊ธฐ ์กฐ์ ์ ์ํ ์ค์ผ์ผ ๊ฐ
๋์:
cost_layer ๊ตฌ์กฐ์ฒด๋ฅผ ์์ฑํ๊ณ , ํ๋๊ฐ๋ค์ ์ด๊ธฐํํ๋ค.
์ ๋ ฅ๋ฐ์ cost_type์ ๋ฐ๋ผ์ l.cost_type์ ์ค์ ํ๋ค.
l.delta, l.output, l.cost ๋ฐฐ์ด์ ์ด๊ธฐํํ๋ค.
forward์ backward ํจ์๋ฅผ ์ค์ ํ๋ค.
์ค๋ช :
์ด ํจ์๋ cost layer๋ฅผ ์์ฑํ๋ ํจ์๋ก, ์ ๋ ฅ๊ฐ๋ค์ ๋ฐ์์ cost layer์ ๊ตฌ์กฐ์ฒด๋ฅผ ์์ฑํ๊ณ ์ด๊ธฐํํ๋ ์ญํ ์ ํ๋ค. ์ด ํจ์๋ฅผ ํตํด์ ์์ฑ๋ cost layer๋ neural network์์ ์ฌ์ฉ๋๋ค.
Last updated
Was this helpful?