#include "darknet.h"
#include <sys/time.h>
#include <assert.h>
extend_data_truth
void extend_data_truth(data *d, int n, float val)
{
int i, j;
for(i = 0; i < d->y.rows; ++i){
d->y.vals[i] = realloc(d->y.vals[i], (d->y.cols+n)*sizeof(float));
for(j = 0; j < n; ++j){
d->y.vals[i][d->y.cols + j] = val;
}
}
d->y.cols += n;
}
ํจ์ ์ด๋ฆ: extend_data_truth
์
๋ ฅ:
(data *d): ๋ฐ์ดํฐ ๊ตฌ์กฐ์ฒด ํฌ์ธํฐ
(int n): ์ถ๊ฐํ ์ด ์
(float val): ์ถ๊ฐํ ๊ฐ
๋์:
๋ฐ์ดํฐ ๊ตฌ์กฐ์ฒด d์ y ํ๋ ฌ์ ๊ฐ ํ์ ๋ํด n๊ฐ์ ์ด์ ์ถ๊ฐํ๊ณ , ํด๋น ์ด์ ๊ฐ์ ๋ชจ๋ val๋ก ์ค์ ํฉ๋๋ค.
์ค๋ช
:
์
๋ ฅ์ผ๋ก ๋ฐ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ์ฒด ํฌ์ธํฐ d์ y ํ๋ ฌ์ n๊ฐ์ ์ด์ ์ถ๊ฐํ๊ณ , ๊ฐ ํ์ ์ถ๊ฐ๋ ์ด๋ค์ ๊ฐ์ ๋ชจ๋ val๋ก ์ค์ ํ๋ ํจ์์
๋๋ค.
์ด ํจ์๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ์
์ y๊ฐ์ ํ์ฅํ ์ ์์ต๋๋ค.
network_loss_data
matrix network_loss_data(network *net, data test)
{
int i,b;
int k = 1;
matrix pred = make_matrix(test.X.rows, k);
float *X = calloc(net->batch*test.X.cols, sizeof(float));
float *y = calloc(net->batch*test.y.cols, sizeof(float));
for(i = 0; i < test.X.rows; i += net->batch){
for(b = 0; b < net->batch; ++b){
if(i+b == test.X.rows) break;
memcpy(X+b*test.X.cols, test.X.vals[i+b], test.X.cols*sizeof(float));
memcpy(y+b*test.y.cols, test.y.vals[i+b], test.y.cols*sizeof(float));
}
network orig = *net;
net->input = X;
net->truth = y;
net->train = 0;
net->delta = 0;
forward_network(net);
*net = orig;
float *delta = net->layers[net->n-1].output;
for(b = 0; b < net->batch; ++b){
if(i+b == test.X.rows) break;
int t = max_index(y + b*test.y.cols, 1000);
float err = sum_array(delta + b*net->outputs, net->outputs);
pred.vals[i+b][0] = -err;
//pred.vals[i+b][0] = 1-delta[b*net->outputs + t];
}
}
free(X);
free(y);
return pred;
}
ํจ์ ์ด๋ฆ: network_loss_data
์
๋ ฅ:
network *net: ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ๋ํ๋ด๋ ํฌ์ธํฐ
data test: ํ
์คํธ ๋ฐ์ดํฐ๋ฅผ ๋ด๊ณ ์๋ ๊ตฌ์กฐ์ฒด ํฌ์ธํฐ
๋์:
์ฃผ์ด์ง ์ ๊ฒฝ๋ง ๋ชจ๋ธ๊ณผ ํ
์คํธ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ๋ชจ๋ธ์ ์์ค๊ฐ์ ๊ณ์ฐํ๋ ํจ์
์
๋ ฅ์ผ๋ก ์ฃผ์ด์ง ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ๊ณ ์ ์ํค๊ณ , ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ํตํด ์์ ํ(forward) ์ฐ์ฐ์ ์ํํ์ฌ ์ถ๋ ฅ๊ฐ์ ๊ณ์ฐํ๊ณ , ์ด๋ฅผ ํ ๋๋ก ์์ค๊ฐ์ ๊ณ์ฐํจ
ํ
์คํธ ๋ฐ์ดํฐ๋ ๋ฐฐ์น(batch) ๋จ์๋ก ์ฒ๋ฆฌ๋จ
์ค๋ช
:
์
๋ ฅ์ผ๋ก ๋ฐ์ ๋ด๋ด ๋คํธ์ํฌ "net"์ ๋ํด ๋ค์๊ณผ ๊ฐ์ ์์
์ ์ํํฉ๋๋ค:
"net->batch" ๊ฐ์ ๋งํผ ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ํฌํจํ๋ ๋ฉ๋ชจ๋ฆฌ "X"์ ์ ๋ต ๋ฐ์ดํฐ๋ฅผ ํฌํจํ๋ ๋ฉ๋ชจ๋ฆฌ "y"๋ฅผ ๋์ ์ผ๋ก ํ ๋นํฉ๋๋ค.
"test.X"์ "test.y"์์ "net->batch" ๊ฐ์ ๋งํผ์ ๋ฐ์ดํฐ๋ฅผ ๋ณต์ฌํ์ฌ "X"์ "y"์ ์ ์ฅํฉ๋๋ค.
"net->train" ๋ณ์๋ฅผ 0์ผ๋ก ์ค์ ํ์ฌ ๋ด๋ด ๋คํธ์ํฌ๋ฅผ ํ
์คํธ ๋ชจ๋๋ก ์ ํํฉ๋๋ค.
"net->delta" ๋ณ์๋ฅผ 0์ผ๋ก ์ด๊ธฐํํฉ๋๋ค.
"forward_network" ํจ์๋ฅผ ํธ์ถํ์ฌ ๋ด๋ด ๋คํธ์ํฌ์ ์ถ๋ ฅ๊ฐ์ ๊ณ์ฐํฉ๋๋ค.
๋ด๋ด ๋คํธ์ํฌ๋ฅผ ์๋์ ์ํ๋ก ๋๋๋ฆฝ๋๋ค.
๊ณ์ฐ๋ ์ถ๋ ฅ๊ฐ "delta"๋ฅผ ์ด์ฉํ์ฌ ๋ค์๊ณผ ๊ฐ์ ์์
์ ์ํํฉ๋๋ค:
๊ฐ mini-batch์ ๋ํด ์ค์ฐจ๋ฅผ ๊ณ์ฐํฉ๋๋ค.
๊ณ์ฐ๋ ์ค์ฐจ๋ฅผ "matrix" ํํ๋ก ์ ์ฅํฉ๋๋ค.
๋ง์ง๋ง์ผ๋ก, ๊ณ์ฐ๋ ์ค์ฐจ๋ฅผ ์ ์ฅํ "matrix"๋ฅผ ๋ฐํํฉ๋๋ค.
train_attention
void train_attention(char *datacfg, char *cfgfile, char *weightfile, int *gpus, int ngpus, int clear)
{
int i, j;
float avg_cls_loss = -1;
float avg_att_loss = -1;
char *base = basecfg(cfgfile);
printf("%s\n", base);
printf("%d\n", ngpus);
network **nets = calloc(ngpus, sizeof(network*));
srand(time(0));
int seed = rand();
for(i = 0; i < ngpus; ++i){
srand(seed);
#ifdef GPU
cuda_set_device(gpus[i]);
#endif
nets[i] = load_network(cfgfile, weightfile, clear);
nets[i]->learning_rate *= ngpus;
}
srand(time(0));
network *net = nets[0];
int imgs = net->batch * net->subdivisions * ngpus;
printf("Learning Rate: %g, Momentum: %g, Decay: %g\n", net->learning_rate, net->momentum, net->decay);
list *options = read_data_cfg(datacfg);
char *backup_directory = option_find_str(options, "backup", "/backup/");
char *label_list = option_find_str(options, "labels", "data/labels.list");
char *train_list = option_find_str(options, "train", "data/train.list");
int classes = option_find_int(options, "classes", 2);
char **labels = get_labels(label_list);
list *plist = get_paths(train_list);
char **paths = (char **)list_to_array(plist);
printf("%d\n", plist->size);
int N = plist->size;
double time;
int divs=3;
int size=2;
load_args args = {0};
args.w = divs*net->w/size;
args.h = divs*net->h/size;
args.size = divs*net->w/size;
args.threads = 32;
args.hierarchy = net->hierarchy;
args.min = net->min_ratio*args.w;
args.max = net->max_ratio*args.w;
args.angle = net->angle;
args.aspect = net->aspect;
args.exposure = net->exposure;
args.saturation = net->saturation;
args.hue = net->hue;
args.paths = paths;
args.classes = classes;
args.n = imgs;
args.m = N;
args.labels = labels;
args.type = CLASSIFICATION_DATA;
data train;
data buffer;
pthread_t load_thread;
args.d = &buffer;
load_thread = load_data(args);
int epoch = (*net->seen)/N;
while(get_current_batch(net) < net->max_batches || net->max_batches == 0){
time = what_time_is_it_now();
pthread_join(load_thread, 0);
train = buffer;
load_thread = load_data(args);
data resized = resize_data(train, net->w, net->h);
extend_data_truth(&resized, divs*divs, 0);
data *tiles = tile_data(train, divs, size);
printf("Loaded: %lf seconds\n", what_time_is_it_now()-time);
time = what_time_is_it_now();
float aloss = 0;
float closs = 0;
int z;
for (i = 0; i < divs*divs/ngpus; ++i) {
#pragma omp parallel for
for(j = 0; j < ngpus; ++j){
int index = i*ngpus + j;
extend_data_truth(tiles+index, divs*divs, SECRET_NUM);
matrix deltas = network_loss_data(nets[j], tiles[index]);
for(z = 0; z < resized.y.rows; ++z){
resized.y.vals[z][train.y.cols + index] = deltas.vals[z][0];
}
free_matrix(deltas);
}
}
int *inds = calloc(resized.y.rows, sizeof(int));
for(z = 0; z < resized.y.rows; ++z){
int index = max_index(resized.y.vals[z] + train.y.cols, divs*divs);
inds[z] = index;
for(i = 0; i < divs*divs; ++i){
resized.y.vals[z][train.y.cols + i] = (i == index)? 1 : 0;
}
}
data best = select_data(tiles, inds);
free(inds);
#ifdef GPU
if (ngpus == 1) {
closs = train_network(net, best);
} else {
closs = train_networks(nets, ngpus, best, 4);
}
#endif
for (i = 0; i < divs*divs; ++i) {
printf("%.2f ", resized.y.vals[0][train.y.cols + i]);
if((i+1)%divs == 0) printf("\n");
free_data(tiles[i]);
}
free_data(best);
printf("\n");
image im = float_to_image(64,64,3,resized.X.vals[0]);
//show_image(im, "orig");
//cvWaitKey(100);
/*
image im1 = float_to_image(64,64,3,tiles[i].X.vals[0]);
image im2 = float_to_image(64,64,3,resized.X.vals[0]);
show_image(im1, "tile");
show_image(im2, "res");
*/
#ifdef GPU
if (ngpus == 1) {
aloss = train_network(net, resized);
} else {
aloss = train_networks(nets, ngpus, resized, 4);
}
#endif
for(i = 0; i < divs*divs; ++i){
printf("%f ", nets[0]->output[1000 + i]);
if ((i+1) % divs == 0) printf("\n");
}
printf("\n");
free_data(resized);
free_data(train);
if(avg_cls_loss == -1) avg_cls_loss = closs;
if(avg_att_loss == -1) avg_att_loss = aloss;
avg_cls_loss = avg_cls_loss*.9 + closs*.1;
avg_att_loss = avg_att_loss*.9 + aloss*.1;
printf("%ld, %.3f: Att: %f, %f avg, Class: %f, %f avg, %f rate, %lf seconds, %ld images\n", get_current_batch(net), (float)(*net->seen)/N, aloss, avg_att_loss, closs, avg_cls_loss, get_current_rate(net), what_time_is_it_now()-time, *net->seen);
if(*net->seen/N > epoch){
epoch = *net->seen/N;
char buff[256];
sprintf(buff, "%s/%s_%d.weights",backup_directory,base, epoch);
save_weights(net, buff);
}
if(get_current_batch(net)%1000 == 0){
char buff[256];
sprintf(buff, "%s/%s.backup",backup_directory,base);
save_weights(net, buff);
}
}
char buff[256];
sprintf(buff, "%s/%s.weights", backup_directory, base);
save_weights(net, buff);
pthread_join(load_thread, 0);
free_network(net);
free_ptrs((void**)labels, classes);
free_ptrs((void**)paths, plist->size);
free_list(plist);
free(base);
}
ํจ์ ์ด๋ฆ: train_attention
์
๋ ฅ:
datacfg (str): ๋ฐ์ดํฐ ๊ตฌ์ฑ์ ์ํ ์ค์ ํ์ผ
cfgfile (str): YOLOv3 ์ํคํ
์ฒ๋ฅผ ์ํ ์ค์ ํ์ผ
weightfile (str): YOLOv3์ ๊ฐ์ค์น ํ์ผ
gpus (list of int): ์ฌ์ฉํ GPU์ ๋ฒํธ๋ฅผ ๋ด์ ๋ฐฐ์ด
ngpus (int): ์ฌ์ฉํ GPU์ ๊ฐ์
clear (bool): ๋์ ๋ ๊ทธ๋๋์ธํธ๋ฅผ ์ง์ธ์ง ์ฌ๋ถ๋ฅผ ์ง์ ํ๋ ํ๋๊ทธ
๋์:
YOLOv3 ๋คํธ์ํฌ๋ฅผ load_network
ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ๋ก๋ํ๋ค.
ํ์ต๋ฅ ์ ngpus * learning_rate
๋ก ์ค์ ํ๊ณ , ์ด๋ learning_rate
๋ ์ค์ ํ์ผ์ ์ ์๋ ํ์ดํผํ๋ผ๋ฏธํฐ์ด๋ค.
train_list
์์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ก๋ํ๋ค.
ํ์ต ๋ฐ์ดํฐ์ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ๊ณ , tile_data
ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ์์ ํ์ผ๋ก ๋๋์ด ๋คํธ์ํฌ์์ ํ์ตํ๋ค.
์ต๋ ๋ฐฐ์น ์๊ฐ ๋๋ฌํ๊ฑฐ๋ ์ค์ ํ์ผ์ max_batches
๋งค๊ฐ๋ณ์๊ฐ 0์ผ๋ก ์ค์ ๋ ๊ฒฝ์ฐ, ํ์ต์ ๋ฌด๊ธฐํ์ผ๋ก ๊ณ์๋๋ค.
๊ฐ ๋ฐ๋ณต์์, ๋ณ๋์ ์ค๋ ๋๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ๋ฐฐ์น๋ฅผ ๋ก๋ํ๊ณ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ ํ, divs*divs
์ต์ปค ๋ฐ์ค๋ฅผ ํฌํจํ๋ ์ง์ค ๊ฐ์ ํ์ฅํ์ฌ ์ ํ๋ ํ์ผ๋ก ๋คํธ์ํฌ๋ฅผ ํ์ตํ๊ณ ๊ทธ๋๋์ธํธ๋ฅผ ์
๋ฐ์ดํธํ๋ค.
์ต์์ ํ์ผ์ ์ ํํ๊ณ ๋ค๋ฅธ ํ์ผ์ ํด์ ํ ํ, ์ ํ๋ ํ์ผ์ ์ดํ
์
๋งต์ ์ถ๋ ฅํ๊ณ ์
๋ ฅ ๋ฐ์ดํฐ์ ์ดํ
์
๋งต์ ์๊ฐํํ๊ธฐ ์ํด ์ด๋ฏธ์ง๋ก ๋ณํํ๋ค.
ํจ์๋ ๋ฐํ๊ฐ์ด ์๋ค.
validate_attention_single
void validate_attention_single(char *datacfg, char *filename, char *weightfile)
{
int i, j;
network *net = load_network(filename, weightfile, 0);
set_batch_network(net, 1);
srand(time(0));
list *options = read_data_cfg(datacfg);
char *label_list = option_find_str(options, "labels", "data/labels.list");
char *leaf_list = option_find_str(options, "leaves", 0);
if(leaf_list) change_leaves(net->hierarchy, leaf_list);
char *valid_list = option_find_str(options, "valid", "data/train.list");
int classes = option_find_int(options, "classes", 2);
int topk = option_find_int(options, "top", 1);
char **labels = get_labels(label_list);
list *plist = get_paths(valid_list);
char **paths = (char **)list_to_array(plist);
int m = plist->size;
free_list(plist);
float avg_acc = 0;
float avg_topk = 0;
int *indexes = calloc(topk, sizeof(int));
int divs = 4;
int size = 2;
int extra = 0;
float *avgs = calloc(classes, sizeof(float));
int *inds = calloc(divs*divs, sizeof(int));
for(i = 0; i < m; ++i){
int class = -1;
char *path = paths[i];
for(j = 0; j < classes; ++j){
if(strstr(path, labels[j])){
class = j;
break;
}
}
image im = load_image_color(paths[i], 0, 0);
image resized = resize_min(im, net->w*divs/size);
image crop = crop_image(resized, (resized.w - net->w*divs/size)/2, (resized.h - net->h*divs/size)/2, net->w*divs/size, net->h*divs/size);
image rcrop = resize_image(crop, net->w, net->h);
//show_image(im, "orig");
//show_image(crop, "cropped");
//cvWaitKey(0);
float *pred = network_predict(net, rcrop.data);
//pred[classes + 56] = 0;
for(j = 0; j < divs*divs; ++j){
printf("%.2f ", pred[classes + j]);
if((j+1)%divs == 0) printf("\n");
}
printf("\n");
copy_cpu(classes, pred, 1, avgs, 1);
top_k(pred + classes, divs*divs, divs*divs, inds);
show_image(crop, "crop");
for(j = 0; j < extra; ++j){
int index = inds[j];
int row = index / divs;
int col = index % divs;
int y = row * crop.h / divs - (net->h - crop.h/divs)/2;
int x = col * crop.w / divs - (net->w - crop.w/divs)/2;
printf("%d %d %d %d\n", row, col, y, x);
image tile = crop_image(crop, x, y, net->w, net->h);
float *pred = network_predict(net, tile.data);
axpy_cpu(classes, 1., pred, 1, avgs, 1);
show_image(tile, "tile");
//cvWaitKey(10);
}
if(net->hierarchy) hierarchy_predictions(pred, net->outputs, net->hierarchy, 1, 1);
if(rcrop.data != resized.data) free_image(rcrop);
if(resized.data != im.data) free_image(resized);
free_image(im);
free_image(crop);
top_k(pred, classes, topk, indexes);
if(indexes[0] == class) avg_acc += 1;
for(j = 0; j < topk; ++j){
if(indexes[j] == class) avg_topk += 1;
}
printf("%d: top 1: %f, top %d: %f\n", i, avg_acc/(i+1), topk, avg_topk/(i+1));
}
}
ํจ์ ์ด๋ฆ: validate_attention_single
์
๋ ฅ:
datacfg: ๋ฐ์ดํฐ ์ค์ ํ์ผ ๊ฒฝ๋ก๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ฌธ์์ด ํฌ์ธํฐ
filename: ๋คํธ์ํฌ ๊ตฌ์กฐ ํ์ผ ๊ฒฝ๋ก๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ฌธ์์ด ํฌ์ธํฐ
weightfile: ๋คํธ์ํฌ ๊ฐ์ค์น ํ์ผ ๊ฒฝ๋ก๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ฌธ์์ด ํฌ์ธํฐ
๋์:
์ฃผ์ด์ง ๋คํธ์ํฌ ๋ชจ๋ธ์ ๋ํด ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ ๊ฒ์ฆ์ ์ํํ๋ ํจ์์
๋๋ค.
์ฃผ์ด์ง ๊ฒฝ๋ก์ ์๋ ์ค์ ํ์ผ์ ์ฝ์ด ๋ฐ์ดํฐ์ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ์ด๊ธฐํํ ํ, ์
๋ ฅ ์ด๋ฏธ์ง๋ฅผ ๋ก๋ํ๊ณ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ๋ฉฐ ๋คํธ์ํฌ ๋ชจ๋ธ์ ์ ์ฉํฉ๋๋ค.
๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๊ณ ์ถ๋ ฅํฉ๋๋ค.
์ด ํจ์๋ ๋ค์๊ณผ ๊ฐ์ ๋์์ ์ํํฉ๋๋ค:
๋ฐ์ดํฐ ์ค์ ํ์ผ(datacfg)์ ์ฝ์ด๋ค์
๋๋ค.
์
๋ ฅ ์ด๋ฏธ์ง์ ํด๋์ค ์(classes), ์์ K(topk) ๊ฐ์ ์ค์ ํฉ๋๋ค.
์
๋ ฅ ์ด๋ฏธ์ง๋ฅผ ๋ก๋ํ๊ณ , ํฌ๊ธฐ๋ฅผ ์กฐ์ ํฉ๋๋ค.
ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ ์ด๋ฏธ์ง๋ฅผ cropํฉ๋๋ค.
cropํ ์ด๋ฏธ์ง๋ฅผ ์ด์ฉํ์ฌ ๋คํธ์ํฌ ๋ชจ๋ธ์ ์ ์ฉํฉ๋๋ค.
๋คํธ์ํฌ ๋ชจ๋ธ์ ์ถ๋ ฅ ๊ฐ์ ์ด์ฉํ์ฌ ์ ํ๋๋ฅผ ํ๊ฐํฉ๋๋ค.
ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํฉ๋๋ค.
์ค๋ช
:
์ด ํจ์๋ Darknet ํ๋ ์์ํฌ์ ์ฝ๋ ์ค ํ๋์
๋๋ค.
์ฃผ์ด์ง ๊ฒฝ๋ก์ ๋ฐ์ดํฐ ์ค์ ํ์ผ(datacfg), ๋คํธ์ํฌ ๊ตฌ์กฐ ํ์ผ(filename), ๋คํธ์ํฌ ๊ฐ์ค์น ํ์ผ(weightfile)์ ์ด์ฉํ์ฌ ๋คํธ์ํฌ ๋ชจ๋ธ์ ์ด๊ธฐํํ๊ณ , ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ ๊ฒ์ฆ์ ์ํํฉ๋๋ค.
๊ฒ์ฆ ๊ฒฐ๊ณผ๋ ํ๊ท ์ ํ๋(avg_acc)์ ํ๊ท ์์ K(topk) ์ ํ๋(avg_topk)๋ฅผ ์ถ๋ ฅํฉ๋๋ค.
validate_attention_multi
void validate_attention_multi(char *datacfg, char *filename, char *weightfile)
{
int i, j;
network *net = load_network(filename, weightfile, 0);
set_batch_network(net, 1);
srand(time(0));
list *options = read_data_cfg(datacfg);
char *label_list = option_find_str(options, "labels", "data/labels.list");
char *valid_list = option_find_str(options, "valid", "data/train.list");
int classes = option_find_int(options, "classes", 2);
int topk = option_find_int(options, "top", 1);
char **labels = get_labels(label_list);
list *plist = get_paths(valid_list);
int scales[] = {224, 288, 320, 352, 384};
int nscales = sizeof(scales)/sizeof(scales[0]);
char **paths = (char **)list_to_array(plist);
int m = plist->size;
free_list(plist);
float avg_acc = 0;
float avg_topk = 0;
int *indexes = calloc(topk, sizeof(int));
for(i = 0; i < m; ++i){
int class = -1;
char *path = paths[i];
for(j = 0; j < classes; ++j){
if(strstr(path, labels[j])){
class = j;
break;
}
}
float *pred = calloc(classes, sizeof(float));
image im = load_image_color(paths[i], 0, 0);
for(j = 0; j < nscales; ++j){
image r = resize_min(im, scales[j]);
resize_network(net, r.w, r.h);
float *p = network_predict(net, r.data);
if(net->hierarchy) hierarchy_predictions(p, net->outputs, net->hierarchy, 1 , 1);
axpy_cpu(classes, 1, p, 1, pred, 1);
flip_image(r);
p = network_predict(net, r.data);
axpy_cpu(classes, 1, p, 1, pred, 1);
if(r.data != im.data) free_image(r);
}
free_image(im);
top_k(pred, classes, topk, indexes);
free(pred);
if(indexes[0] == class) avg_acc += 1;
for(j = 0; j < topk; ++j){
if(indexes[j] == class) avg_topk += 1;
}
printf("%d: top 1: %f, top %d: %f\n", i, avg_acc/(i+1), topk, avg_topk/(i+1));
}
}
ํจ์ ์ด๋ฆ: validate_attention_multi
์
๋ ฅ:
char* datacfg: ๋ฐ์ดํฐ ์ค์ ํ์ผ ๊ฒฝ๋ก
char* filename: ๋คํธ์ํฌ ๊ตฌ์ฑ ํ์ผ ๊ฒฝ๋ก
char* weightfile: ํ์ต๋ ๋ชจ๋ธ์ ๊ฐ์ค์น ํ์ผ ๊ฒฝ๋ก
๋์:
๋ค์ค ํฌ๊ธฐ์ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํ์ฌ ์ง์ ๋ ๋คํธ์ํฌ๋ฅผ ๊ฒ์ฆํ๋ ํจ์์
๋๋ค.
๋คํธ์ํฌ๊ฐ ์ ํํ๊ฒ ๋ถ๋ฅํ๋ ์ด๋ฏธ์ง์ ๋น์จ๊ณผ ์์ k๊ฐ ๋ถ๋ฅ ์ค ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅํ๋ ์ด๋ฏธ์ง์ ๋น์จ์ ์ถ๋ ฅํฉ๋๋ค.
์ค๋ช
:
๋คํธ์ํฌ ๊ตฌ์ฑ ํ์ผ๊ณผ ๊ฐ์ค์น ํ์ผ์ ๋ก๋ํ๊ณ , ๋ฐฐ์น ํฌ๊ธฐ๋ฅผ 1๋ก ์ค์ ํฉ๋๋ค.
๋ฐ์ดํฐ ์ค์ ํ์ผ์์ ๋ ์ด๋ธ ๋ชฉ๋ก, ๊ฒ์ฆ ์ด๋ฏธ์ง ๋ชฉ๋ก, ํด๋์ค ์, ์์ k๊ฐ๋ฅผ ๊ฐ์ ธ์ต๋๋ค.
๊ฒ์ฆ ์ด๋ฏธ์ง๋ฅผ ์ฝ์ด๋ค์ด๊ณ , ๋ค์ค ํฌ๊ธฐ๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์กฐ์ ํ๊ณ , ๋คํธ์ํฌ๋ฅผ ํตํด ์์ธกํฉ๋๋ค.
์์ธก ๊ฒฐ๊ณผ์์ ์์ k๊ฐ ๋ถ๋ฅ๋ฅผ ์ ํํ๊ณ , ์ ํ๋์ ์์ k๊ฐ์ ์ ํ๋๋ฅผ ๊ณ์ฐํฉ๋๋ค.
๋ชจ๋ ๊ฒ์ฆ ์ด๋ฏธ์ง์ ๋ํด ์ ํ๋์ ์์ k๊ฐ์ ์ ํ๋๋ฅผ ๊ณ์ฐํ๊ณ ์ถ๋ ฅํฉ๋๋ค.
predict_attention
void predict_attention(char *datacfg, char *cfgfile, char *weightfile, char *filename, int top)
{
network *net = load_network(cfgfile, weightfile, 0);
set_batch_network(net, 1);
srand(2222222);
list *options = read_data_cfg(datacfg);
char *name_list = option_find_str(options, "names", 0);
if(!name_list) name_list = option_find_str(options, "labels", "data/labels.list");
if(top == 0) top = option_find_int(options, "top", 1);
int i = 0;
char **names = get_labels(name_list);
clock_t time;
int *indexes = calloc(top, sizeof(int));
char buff[256];
char *input = buff;
while(1){
if(filename){
strncpy(input, filename, 256);
}else{
printf("Enter Image Path: ");
fflush(stdout);
input = fgets(input, 256, stdin);
if(!input) return;
strtok(input, "\n");
}
image im = load_image_color(input, 0, 0);
image r = letterbox_image(im, net->w, net->h);
//resize_network(&net, r.w, r.h);
//printf("%d %d\n", r.w, r.h);
float *X = r.data;
time=clock();
float *predictions = network_predict(net, X);
if(net->hierarchy) hierarchy_predictions(predictions, net->outputs, net->hierarchy, 1, 1);
top_k(predictions, net->outputs, top, indexes);
fprintf(stderr, "%s: Predicted in %f seconds.\n", input, sec(clock()-time));
for(i = 0; i < top; ++i){
int index = indexes[i];
//if(net->hierarchy) printf("%d, %s: %f, parent: %s \n",index, names[index], predictions[index], (net->hierarchy->parent[index] >= 0) ? names[net->hierarchy->parent[index]] : "Root");
//else printf("%s: %f\n",names[index], predictions[index]);
printf("%5.2f%%: %s\n", predictions[index]*100, names[index]);
}
if(r.data != im.data) free_image(r);
free_image(im);
if (filename) break;
}
}
ํจ์ ์ด๋ฆ: predict_attention
์
๋ ฅ:
char *datacfg: ๋ฐ์ดํฐ ๊ตฌ์ฑ ํ์ผ์ ๊ฒฝ๋ก๋ฅผ ๋ํ๋ด๋ ๋ฌธ์์ด ํฌ์ธํฐ
char *cfgfile: YOLO ๋คํธ์ํฌ ๊ตฌ์ฑ ํ์ผ์ ๊ฒฝ๋ก๋ฅผ ๋ํ๋ด๋ ๋ฌธ์์ด ํฌ์ธํฐ
char *weightfile: YOLO ๋คํธ์ํฌ ๊ฐ์ค์น ํ์ผ์ ๊ฒฝ๋ก๋ฅผ ๋ํ๋ด๋ ๋ฌธ์์ด ํฌ์ธํฐ
char *filename: ์ด๋ฏธ์ง ํ์ผ ๊ฒฝ๋ก๋ฅผ ๋ํ๋ด๋ ๋ฌธ์์ด ํฌ์ธํฐ (์ ํ์ )
int top: ์์ธก ๊ฒฐ๊ณผ์์ ์์ N๊ฐ์ ํด๋์ค๋ฅผ ๋ณด์ฌ์ค์ง ๊ฒฐ์ ํ๋ ์ ์
๋์:
YOLO ๋คํธ์ํฌ๋ฅผ ๋ก๋ํ๊ณ ์
๋ ฅ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ์ฌ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํ๋ ํจ์
์
๋ ฅ ์ด๋ฏธ์ง ๊ฒฝ๋ก๋ฅผ ์ง์ ์
๋ ฅํ๊ฑฐ๋ ์ธ์๋ก ์ ๋ฌ๋ฐ์ ์ด๋ฏธ์ง ํ์ผ ๊ฒฝ๋ก๋ฅผ ์ฌ์ฉ
์์ธก ๊ฒฐ๊ณผ์์ ์์ N๊ฐ์ ํด๋์ค๋ฅผ ๋ณด์ฌ์ค
ํจ์๊ฐ ์ข
๋ฃ๋๊ธฐ ์ ๊น์ง ๋ฌดํ ๋ฃจํ๋ฅผ ์คํํ์ฌ ๊ณ์ํด์ ์
๋ ฅ ์ด๋ฏธ์ง๋ฅผ ๋ฐ์ ์ ์์
์ค๋ช
:
ํจ์๋ YOLO ๋คํธ์ํฌ๋ฅผ ๋ก๋ํ๊ณ , ์ด๋ฅผ ์ด์ฉํ์ฌ ์
๋ ฅ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ๊ฐ์งํ๊ณ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํจ
์์ธก ๊ฒฐ๊ณผ์์ ๋ณด์ฌ์ค ํด๋์ค์ ์(top)๋ ์
๋ ฅ์ผ๋ก ๋ฐ๊ฑฐ๋, ๋ฐ์ดํฐ ๊ตฌ์ฑ ํ์ผ์์ ์ฐพ๊ฑฐ๋ ๊ธฐ๋ณธ๊ฐ 1๋ก ์ค์ ๋จ
ํจ์๋ ๋ฌดํ ๋ฃจํ๋ฅผ ์คํํ๋ฉฐ, ์ฌ์ฉ์๊ฐ ์ง์ ์ด๋ฏธ์ง ๊ฒฝ๋ก๋ฅผ ์
๋ ฅํ๊ฑฐ๋ ์ธ์๋ก ์ ๋ฌ๋ฐ์ ์ด๋ฏธ์ง ํ์ผ ๊ฒฝ๋ก๋ฅผ ์ฌ์ฉํ์ฌ ์์ธก์ ์ํํจ
์์ธก ๊ฒฐ๊ณผ์์๋ ๊ฐ ํด๋์ค์ ์ด๋ฆ๊ณผ ํด๋น ํด๋์ค์ผ ํ๋ฅ ์ด ๋ฐฑ๋ถ์จ๋ก ์ถ๋ ฅ๋จ
ํจ์๊ฐ ์คํ๋๋ฉด ๋จผ์ ์
๋ ฅ ์ด๋ฏธ์ง๋ฅผ ๋ก๋ํ๊ณ , YOLO ๋คํธ์ํฌ์์ ์ฌ์ฉ๋๋ ํฌ๊ธฐ๋ก ์ด๋ฏธ์ง๋ฅผ ์กฐ์ ํจ
์ดํ, ์์ธก์ ์ํํ๊ณ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํจ
์์ธก ๊ฒฐ๊ณผ๋ ํด๋์ค์ ์ด๋ฆ๊ณผ ํ๋ฅ ๊ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ผ๋ฉฐ, ์์ N๊ฐ์ ํด๋์ค๋ง ์ถ๋ ฅํจ
ํจ์๊ฐ ์ข
๋ฃ๋๊ธฐ ์ ๊น์ง ๋ฌดํ ๋ฃจํ๋ฅผ ์คํํ์ฌ ๊ณ์ํด์ ์
๋ ฅ ์ด๋ฏธ์ง๋ฅผ ๋ฐ์ ์ ์์
run_attention
void run_attention(int argc, char **argv)
{
if(argc < 4){
fprintf(stderr, "usage: %s %s [train/test/valid] [cfg] [weights (optional)]\n", argv[0], argv[1]);
return;
}
char *gpu_list = find_char_arg(argc, argv, "-gpus", 0);
int ngpus;
int *gpus = read_intlist(gpu_list, &ngpus, gpu_index);
int top = find_int_arg(argc, argv, "-t", 0);
int clear = find_arg(argc, argv, "-clear");
char *data = argv[3];
char *cfg = argv[4];
char *weights = (argc > 5) ? argv[5] : 0;
char *filename = (argc > 6) ? argv[6]: 0;
char *layer_s = (argc > 7) ? argv[7]: 0;
if(0==strcmp(argv[2], "predict")) predict_attention(data, cfg, weights, filename, top);
else if(0==strcmp(argv[2], "train")) train_attention(data, cfg, weights, gpus, ngpus, clear);
else if(0==strcmp(argv[2], "valid")) validate_attention_single(data, cfg, weights);
else if(0==strcmp(argv[2], "validmulti")) validate_attention_multi(data, cfg, weights);
}
ํจ์ ์ด๋ฆ: run_attention
์
๋ ฅ:
argc: int, ํ๋ก๊ทธ๋จ ์คํ ์ ์ ๋ฌ๋ ์ธ์์ ๊ฐ์
argv: char**, ํ๋ก๊ทธ๋จ ์คํ ์ ์ ๋ฌ๋ ์ธ์๋ค์ ๋ฐฐ์ด
๋์:
์ฃผ์ด์ง ์ธ์๋ค์ ๋ถ์ํ์ฌ ํด๋นํ๋ ์์
์ ์คํํจ
"predict" ์ธ์๊ฐ ์ฃผ์ด์ง๋ฉด, predict_attention ํจ์๋ฅผ ํธ์ถํ์ฌ ์ด๋ฏธ์ง ํ์ผ์ ๊ฒฝ๋ก๋ฅผ ์
๋ ฅ๋ฐ๊ณ ํด๋น ์ด๋ฏธ์ง์ ๋ํ ๊ฐ์ฒด ์ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํจ
"train" ์ธ์๊ฐ ์ฃผ์ด์ง๋ฉด, train_attention ํจ์๋ฅผ ํธ์ถํ์ฌ ์ง์ ๋ ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ ๋ชจ๋ธ์ ํ์ต์ํด
"valid" ์ธ์๊ฐ ์ฃผ์ด์ง๋ฉด, validate_attention_single ํจ์๋ฅผ ํธ์ถํ์ฌ ์ง์ ๋ ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํจ
"validmulti" ์ธ์๊ฐ ์ฃผ์ด์ง๋ฉด, validate_attention_multi ํจ์๋ฅผ ํธ์ถํ์ฌ ์ง์ ๋ ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํจ
์ค๋ช
:
gpu_list: char*, ์ฌ์ฉํ GPU ๋ชฉ๋ก์ ์ง์ ํจ
ngpus: int, ์ฌ์ฉํ GPU์ ๊ฐ์
gpus: int*, ์ฌ์ฉํ GPU์ ์ธ๋ฑ์ค
top: int, ๊ฐ์ฒด ์ธ์ ๊ฒฐ๊ณผ ์ค ์์ ๋ช ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํ ์ง ์ง์ ํจ
clear: int, ํ์ต์ ์์ํ๊ธฐ ์ ์ ์ด์ ์ ํ์ต๋ ๋ด์ฉ์ ์ญ์ ํ ์ง ์ฌ๋ถ๋ฅผ ์ง์ ํจ
data: char*, ๋ฐ์ดํฐ์
์ ๊ฒฝ๋ก๋ฅผ ์ง์ ํจ
cfg: char*, ๋ชจ๋ธ์ ์ค์ ํ์ผ ๊ฒฝ๋ก๋ฅผ ์ง์ ํจ
weights: char*, ๋ชจ๋ธ์ ๊ฐ์ค์น ํ์ผ ๊ฒฝ๋ก๋ฅผ ์ง์ ํจ (์๋ต ๊ฐ๋ฅ)
filename: char*, ๊ฐ์ฒด ์ธ์์ ์ํํ ์ด๋ฏธ์ง ํ์ผ์ ๊ฒฝ๋ก๋ฅผ ์ง์ ํจ (์๋ต ๊ฐ๋ฅ)
layer_s: char*, ๋ชจ๋ธ์์ ์ถ๋ ฅํ ๋ ์ด์ด ์ด๋ฆ์ ์ง์ ํจ (์๋ต ๊ฐ๋ฅ)