iseg_layer
instance segmentation을 위한 layer입니다.
forward_iseg_layer
함수 이름: forward_iseg_layer
입력:
layer 구조체와 network 구조체
동작:
이미지 분할을 위한 인스턴스 임베딩을 계산하고, 임베딩 손실을 계산하여 네트워크의 출력을 업데이트합니다.
설명:
이 함수는 YOLOv3-tiny 네트워크의 일부로 사용되는 이미지 분할 레이어를 수행합니다.
이 함수는 입력 이미지의 크기와 분할된 클래스 수에 따라 출력 텐서의 크기를 결정합니다.
이 함수의 핵심 기능은 이미지의 각 픽셀에 대한 인스턴스 임베딩을 계산하는 것입니다.
이를 위해, 함수는 참값(truth)으로부터 각 인스턴스에 대한 임베딩을 추출합니다.
추출한 임베딩과 네트워크의 출력 간의 차이를 계산하여 임베딩 손실을 계산하고, 이를 사용하여 네트워크의 가중치를 업데이트합니다.
이 함수는 또한 임베딩 손실을 계산하기 위해 평균 제곱 오차(mse)를 계산합니다.
함수는 또한 경계 상자와 함께 사용할 수 있는 좌표와 클래스 예측을 포함하는 출력 텐서를 생성합니다.
backward_iseg_layer
함수 이름: backward_iseg_layer
입력:
const layer l
network net
동작:
l.delta와 net.delta를 더한 결과를 net.delta에 저장합니다.
설명:
iSeg 레이어의 역전파(backward propagation)를 수행하는 함수입니다.
l.delta와 net.delta는 각각 iSeg 레이어와 연결된 레이어의 delta값과 네트워크 전체의 delta값을 저장하는 배열입니다.
이 함수는 l.delta와 net.delta를 더한 결과를 net.delta에 저장합니다.
이 과정은 연결된 레이어의 delta값을 이용하여 이전 레이어의 gradient를 계산하기 위해 필요합니다.
resize_iseg_layer
함수 이름: resize_iseg_layer
입력:
layer *l : 레이어 구조체 포인터
int w : 레이어의 새로운 너비
int h : 레이어의 새로운 높이
동작:
입력으로 받은 레이어 포인터를 이용하여 l->w와 l->h를 각각 w와 h로 변경하고, l->c와 w, h를 이용하여 l->outputs과 l->inputs을 다시 계산하여 업데이트합니다.
그리고 l->output과 l->delta를 레이어의 새로운 크기에 맞게 재할당합니다.
설명:
이 함수는 인풋 세그멘테이션 레이어를 리사이징할 때 사용됩니다.
이 함수를 호출하면 레이어의 크기가 변경되며, 레이어의 아웃풋과 델타 배열도 리사이징된 크기에 맞게 재할당됩니다.
이 함수를 통해 레이어의 크기를 적절히 조절하여 모델을 튜닝할 수 있습니다.
make_iseg_layer
함수 이름: make_iseg_layer
입력:
batch: int 타입, batch size
w: int 타입, 입력 이미지의 너비 (width)
h: int 타입, 입력 이미지의 높이 (height)
classes: int 타입, segmentation 클래스 수
ids: int 타입, 추가적인 segmentation ID 수
동작:
입력으로 받은 파라미터를 이용하여, 인스턴스 분할(segmentation) 레이어를 생성하고 초기화한 후 반환한다.
설명:
layer 구조체 변수 l을 초기화하고, 필요한 값들을 할당한다.
l.type을 ISEG로 설정하고, l.h, l.w, l.c, l.out_w, l.out_h, l.out_c, l.classes, l.batch, l.extra, l.outputs, l.inputs, l.truths, l.delta, l.output, l.counts, l.sums, l.cost 등의 변수를 설정한다.
l.sums 배열의 메모리를 할당하고, ids가 0이 아니면, 각각의 원소마다 추가적인 메모리를 할당한다.
l.forward와 l.backward 함수를 설정하고, "iseg"라는 문자열을 출력한다.
초기화된 layer 구조체 l을 반환한다.
Last updated