regressor

#include "darknet.h"
#include <sys/time.h>
#include <assert.h>

train_regressor

void train_regressor(char *datacfg, char *cfgfile, char *weightfile, int *gpus, int ngpus, int clear)
{
    int i;

    float avg_loss = -1;
    char *base = basecfg(cfgfile);
    printf("%s\n", base);
    printf("%d\n", ngpus);
    network **nets = calloc(ngpus, sizeof(network*));

    srand(time(0));
    int seed = rand();
    for(i = 0; i < ngpus; ++i){
        srand(seed);
#ifdef GPU
        cuda_set_device(gpus[i]);
#endif
        nets[i] = load_network(cfgfile, weightfile, clear);
        nets[i]->learning_rate *= ngpus;
    }
    srand(time(0));
    network *net = nets[0];

    int imgs = net->batch * net->subdivisions * ngpus;

    printf("Learning Rate: %g, Momentum: %g, Decay: %g\n", net->learning_rate, net->momentum, net->decay);
    list *options = read_data_cfg(datacfg);

    char *backup_directory = option_find_str(options, "backup", "/backup/");
    char *train_list = option_find_str(options, "train", "data/train.list");
    int classes = option_find_int(options, "classes", 1);

    list *plist = get_paths(train_list);
    char **paths = (char **)list_to_array(plist);
    printf("%d\n", plist->size);
    int N = plist->size;
    clock_t time;

    load_args args = {0};
    args.w = net->w;
    args.h = net->h;
    args.threads = 32;
    args.classes = classes;

    args.min = net->min_ratio*net->w;
    args.max = net->max_ratio*net->w;
    args.angle = net->angle;
    args.aspect = net->aspect;
    args.exposure = net->exposure;
    args.saturation = net->saturation;
    args.hue = net->hue;
    args.size = net->w;

    args.paths = paths;
    args.n = imgs;
    args.m = N;
    args.type = REGRESSION_DATA;

    data train;
    data buffer;
    pthread_t load_thread;
    args.d = &buffer;
    load_thread = load_data(args);

    int epoch = (*net->seen)/N;
    while(get_current_batch(net) < net->max_batches || net->max_batches == 0){
        time=clock();

        pthread_join(load_thread, 0);
        train = buffer;
        load_thread = load_data(args);

        printf("Loaded: %lf seconds\n", sec(clock()-time));
        time=clock();

        float loss = 0;
#ifdef GPU
        if(ngpus == 1){
            loss = train_network(net, train);
        } else {
            loss = train_networks(nets, ngpus, train, 4);
        }
#else
        loss = train_network(net, train);
#endif
        if(avg_loss == -1) avg_loss = loss;
        avg_loss = avg_loss*.9 + loss*.1;
        printf("%ld, %.3f: %f, %f avg, %f rate, %lf seconds, %ld images\n", get_current_batch(net), (float)(*net->seen)/N, loss, avg_loss, get_current_rate(net), sec(clock()-time), *net->seen);
        free_data(train);
        if(*net->seen/N > epoch){
            epoch = *net->seen/N;
            char buff[256];
            sprintf(buff, "%s/%s_%d.weights",backup_directory,base, epoch);
            save_weights(net, buff);
        }
        if(get_current_batch(net)%100 == 0){
            char buff[256];
            sprintf(buff, "%s/%s.backup",backup_directory,base);
            save_weights(net, buff);
        }
    }
    char buff[256];
    sprintf(buff, "%s/%s.weights", backup_directory, base);
    save_weights(net, buff);

    free_network(net);
    free_ptrs((void**)paths, plist->size);
    free_list(plist);
    free(base);
}

함수 이름: train_regressor

입력:

  • datacfg: char 형식의 데이터 파일 경로

  • cfgfile: char 형식의 네트워크 설정 파일 경로

  • weightfile: char 형식의 미리 학습된 가중치 파일 경로

  • gpus: int 배열 형식의 GPU 번호

  • ngpus: int 형식의 GPU 개수

  • clear: int 형식의 클리어 여부

동작:

  • 주어진 데이터 파일, 네트워크 설정 파일, 미리 학습된 가중치 파일, GPU 번호 및 개수를 사용하여 회귀 모델을 학습시킵니다.

  • 이 함수는 YOLO 알고리즘을 사용하여 학습을 수행합니다.

  • 학습 중에는 네트워크의 학습률, 모멘텀, 감쇠 및 데이터 경로 등의 정보가 표시됩니다.

입력을 설명할 때:

  • char 형식의 데이터 파일 경로: 학습에 사용될 데이터 파일의 경로

  • char 형식의 네트워크 설정 파일 경로: 네트워크 설정 파일의 경로

  • char 형식의 미리 학습된 가중치 파일 경로: 미리 학습된 가중치 파일의 경로

  • int 배열 형식의 GPU 번호: 사용할 GPU의 번호

  • int 형식의 GPU 개수: 사용할 GPU의 개수

  • int 형식의 클리어 여부: 1이면 이전의 학습 결과를 지우고 새로운 학습을 시작합니다. 0이면 이전의 학습 결과를 유지하고 새로운 학습을 시작합니다.

predict_regressor

void predict_regressor(char *cfgfile, char *weightfile, char *filename)
{
    network *net = load_network(cfgfile, weightfile, 0);
    set_batch_network(net, 1);
    srand(2222222);

    clock_t time;
    char buff[256];
    char *input = buff;
    while(1){
        if(filename){
            strncpy(input, filename, 256);
        }else{
            printf("Enter Image Path: ");
            fflush(stdout);
            input = fgets(input, 256, stdin);
            if(!input) return;
            strtok(input, "\n");
        }
        image im = load_image_color(input, 0, 0);
        image sized = letterbox_image(im, net->w, net->h);

        float *X = sized.data;
        time=clock();
        float *predictions = network_predict(net, X);
        printf("Predicted: %f\n", predictions[0]);
        printf("%s: Predicted in %f seconds.\n", input, sec(clock()-time));
        free_image(im);
        free_image(sized);
        if (filename) break;
    }
}

함수 이름: predict_regressor

입력:

  • cfgfile: 신경망 구성 파일 경로를 가리키는 문자열 포인터

  • weightfile: 학습된 가중치 파일 경로를 가리키는 문자열 포인터

  • filename: 입력 이미지 파일 경로를 가리키는 문자열 포인터 (선택적)

동작:

  • 이 함수는 cfgfile과 weightfile을 사용하여 학습된 회귀 신경망을 로드합니다.

  • 사용자가 이미지 파일 경로를 입력하거나 파일 이름이 이미 함수 호출 시 제공되었다면, 함수는 해당 이미지를 로드하고 신경망을 통해 예측을 수행합니다. 예측 결과는 콘솔에 출력됩니다.

설명:

  • 이 함수는 Darknet 라이브러리를 사용하여 작성된 함수입니다.

  • 이 함수는 회귀 문제를 푸는 데 사용되는 신경망 모델을 로드하고, 이미지 파일 경로를 입력받아 해당 이미지를 예측합니다.

  • 이 함수는 이미지 파일 경로를 입력으로 받을 수도 있고, 함수를 호출하는 시점에서 이미 파일 이름이 제공된 경우에는 파일 이름을 인자로 전달할 수 있습니다.

  • 이 함수는 입력 이미지를 로드하고, letterbox_image 함수를 사용하여 이미지를 모델에 맞는 크기로 변환한 다음, 네트워크를 통해 예측을 수행합니다.

  • 마지막으로, 예측 결과를 콘솔에 출력합니다.

demo_regressor

void demo_regressor(char *datacfg, char *cfgfile, char *weightfile, int cam_index, const char *filename)
{
#ifdef OPENCV
    printf("Regressor Demo\n");
    network *net = load_network(cfgfile, weightfile, 0);
    set_batch_network(net, 1);

    srand(2222222);
    list *options = read_data_cfg(datacfg);
    int classes = option_find_int(options, "classes", 1);
    char *name_list = option_find_str(options, "names", 0);
    char **names = get_labels(name_list);

    void * cap = open_video_stream(filename, cam_index, 0,0,0);
    if(!cap) error("Couldn't connect to webcam.\n");
    float fps = 0;

    while(1){
        struct timeval tval_before, tval_after, tval_result;
        gettimeofday(&tval_before, NULL);

        image in = get_image_from_stream(cap);
        image crop = center_crop_image(in, net->w, net->h);
        grayscale_image_3c(crop);

        float *predictions = network_predict(net, crop.data);

        printf("\033[2J");
        printf("\033[1;1H");
        printf("\nFPS:%.0f\n",fps);

        int i;
        for(i = 0; i < classes; ++i){
            printf("%s: %f\n", names[i], predictions[i]);
        }

        show_image(crop, "Regressor", 10);
        free_image(in);
        free_image(crop);

        gettimeofday(&tval_after, NULL);
        timersub(&tval_after, &tval_before, &tval_result);
        float curr = 1000000.f/((long int)tval_result.tv_usec);
        fps = .9*fps + .1*curr;
    }
#endif
}

함수 이름: demo_regressor

입력:

  • datacfg: char 형식의 데이터 파일 경로

  • cfgfile: char 형식의 네트워크 구성 파일 경로

  • weightfile: char 형식의 가중치 파일 경로

  • cam_index: int 형식의 카메라 인덱스 (0 이상)

  • filename: char 형식의 동영상 파일 경로 또는 NULL

동작:

  • OpenCV 라이브러리를 사용하여 카메라 또는 동영상에서 입력 이미지를 받아와서,

  • 받아온 이미지를 네트워크 입력 크기에 맞게 중앙을 기준으로 자르고 그레이스케일로 변환하여,

  • 네트워크를 사용하여 이미지를 예측하고 결과를 출력하며,

  • 예측 속도를 계산하여 화면에 출력한다.

설명:

  • 입력된 파일 경로로부터 데이터, 구성 및 가중치 파일을 읽어서 네트워크를 생성한다.

  • 카메라 인덱스가 0보다 큰 경우는 해당 인덱스의 카메라로부터 이미지를 가져오고, filename 인자가 NULL이 아닌 경우는 해당 파일로부터 이미지를 가져온다.

  • 받아온 이미지를 중앙을 기준으로 자르고 그레이스케일로 변환한다.

  • 네트워크를 사용하여 이미지를 예측하고, 결과를 출력한다.

  • 결과는 클래스 레이블과 해당 클래스에 대한 예측 값으로 이루어져 있다.

  • 예측 속도를 계산하여 화면에 출력한다.

run_regressor

void run_regressor(int argc, char **argv)
{
    if(argc < 4){
        fprintf(stderr, "usage: %s %s [train/test/valid] [cfg] [weights (optional)]\n", argv[0], argv[1]);
        return;
    }

    char *gpu_list = find_char_arg(argc, argv, "-gpus", 0);
    int *gpus = 0;
    int gpu = 0;
    int ngpus = 0;
    if(gpu_list){
        printf("%s\n", gpu_list);
        int len = strlen(gpu_list);
        ngpus = 1;
        int i;
        for(i = 0; i < len; ++i){
            if (gpu_list[i] == ',') ++ngpus;
        }
        gpus = calloc(ngpus, sizeof(int));
        for(i = 0; i < ngpus; ++i){
            gpus[i] = atoi(gpu_list);
            gpu_list = strchr(gpu_list, ',')+1;
        }
    } else {
        gpu = gpu_index;
        gpus = &gpu;
        ngpus = 1;
    }

    int cam_index = find_int_arg(argc, argv, "-c", 0);
    int clear = find_arg(argc, argv, "-clear");
    char *data = argv[3];
    char *cfg = argv[4];
    char *weights = (argc > 5) ? argv[5] : 0;
    char *filename = (argc > 6) ? argv[6]: 0;
    if(0==strcmp(argv[2], "test")) predict_regressor(data, cfg, weights);
    else if(0==strcmp(argv[2], "train")) train_regressor(data, cfg, weights, gpus, ngpus, clear);
    else if(0==strcmp(argv[2], "demo")) demo_regressor(data, cfg, weights, cam_index, filename);
}

함수 이름: run_regressor

입력:

  • int argc: 프로그램 실행 시 전달된 인자의 개수

  • char **argv: 프로그램 실행 시 전달된 인자들의 배열

동작:

  • 입력으로 받은 인자들을 기반으로, regressor를 테스트, 훈련, 데모 실행하는 함수

  • 인자로 "test"가 전달된 경우 predict_regressor() 함수를 실행하여 regressor 모델을 테스트

  • 인자로 "train"이 전달된 경우 train_regressor() 함수를 실행하여 regressor 모델을 훈련

  • 인자로 "demo"가 전달된 경우 demo_regressor() 함수를 실행하여 regressor 모델의 데모 실행

  • "-gpus" 인자를 통해 GPU ID를 설정할 수 있으며, 쉼표로 구분된 문자열 형태로 전달

  • "-c" 인자를 통해 카메라 장치의 인덱스를 설정할 수 있음

  • "-clear" 인자를 전달하면, 훈련 시 이전에 저장된 모든 기록 삭제

  • 인자로 전달된 데이터 파일, 설정 파일, 가중치 파일, 파일 이름 등을 적절히 파싱하여 사용

설명:

  • run_regressor() 함수는 Darknet 프레임워크의 regressor 모델을 테스트, 훈련, 데모 실행하는 함수입니다.

  • 입력으로 받은 인자들을 기반으로, 각각의 동작을 수행합니다.

  • "-gpus" 인자를 통해 GPU ID를 설정할 수 있으며, 쉼표로 구분된 문자열 형태로 전달할 수 있습니다. 만약 이 인자가 전달되지 않은 경우, 기본적으로 GPU 0번을 사용합니다.

  • "-c" 인자를 통해 카메라 장치의 인덱스를 설정할 수 있습니다. 이 인자가 전달되지 않은 경우, 기본값 0을 사용합니다.

  • "-clear" 인자를 전달하면, 훈련 시 이전에 저장된 모든 기록을 삭제합니다.

  • 인자로 전달된 데이터 파일, 설정 파일, 가중치 파일, 파일 이름 등을 적절히 파싱하여 사용합니다. 이 함수는 predict_regressor(), train_regressor(), demo_regressor() 함수를 호출하여 regressor 모델을 테스트, 훈련, 데모 실행합니다.

Last updated

Was this helpful?