Open-Domain Question Answering

주어진 지문을 이해하고, 주어진 질의의 답변을 추론하는 태스크

일정 Schedule

프로젝트 전체 기간(2주): 6월 7일 (수) 10:00 ~ 6월 22일 (목) 19:00

대회 플랫폼 Platform

팀 Team

훈제연어들

문지혜	박경택	박지은	송인서	윤지환

랩업리포트 Wrap-up Report

code/assets/MRC_NLP_팀 리포트(12조).pdf

저장소 구조 Repository Structure

level2_nlp_mrc-nlp-12/
│
├── code/
│   ├── assets/
│   │
│   ├── eda/
│   │   ├── eda.ipynb
│   │   └── post_eda.ipynb
│   │
│   ├── install/
│   │   ├── elastic_install.sh
│   │   └── install_requirements.sh
│   │
│   ├── retriever/                              # Retiever 실험 코드 모음
│   │   ├── elastic_setting.json                # retrieval_elastic.py를 위한 설정 파일
│   │   ├── retrieval_bm25.py                   # BM25 실험
│   │   ├── retrieval_elastic.py                # elastic search 적용 코드
│   │   ├── retrieval_faiss.py                  # FAISS 적용 코드
│   │   └── retrieval_tfidf.py                  # TFIDF 실험 코드
│   │
│   ├── trainer/
│   │   └── trainer_qa.py
│   │
│   ├── utils/
│   │   ├── evalutaion.py
│   │   └── utils_qa.py
│   │
│   ├── arguments.py
│   ├── inference.py                            # ODQA 모델 평가 또는 제출 파일 (predictions.json) 생성
│   ├── inference.sh                            # inference.py를 실행하기 위한 스크립트
│   ├── load_data.py                            # 데이터셋을 정의하고 DatasetDict를 반환하는 스크립트
│   ├── run.sh                                  # train.py를 실행하기 위한 스크립트
│   ├── run_mrc.py
│   ├── train.py				# MRC, Retrieval 모델 학습 및 평가
│   └── README.md				# ODQA 모델 평가 또는 제출 파일 (predictions.json) 생성
│
├── data/
│   ├── retrieved_context_dataset/              # retrieval에 사용되는 corpus
│   │   ├── train_3.csv
│   │   └── valid_3.csv
│   │
│   ├── test_dataset/                           # MRC 모델 학습에 사용되는 데이터
│   │   ├── validation/
│   │   └── dataset_dict.json
│   │
│   └── train_dataset/                          # MRC 모델 학습에 사용되는 데이터
│       ├── trian/
│       ├── validation/
│       └── dataset_dict.json
│
└── README.md

사용법 Usage

train

$ ./code/run.sh

inference

$ ./code/inference.sh

평가 방법 Evaluation Metric

Exact Match(EM)
- 모델의 예측과 실제 답이 정확하게 일치하는 경우 1, 아니면 0
- 띄어쓰기나 특수문자를 제외하여 비교
- 여러 개의 실제 답 중 하나라도 일치하는 경우 정답
F1 Score
- 리더보드에 반영되지 않는 참고용 점수
- 예측한 답과 ground-truth 사이의 token overlap을 f1으로 계산

대회 결과

리더보드	순위	EM	F1
Public	8	68.33	78.57
Private	10 (2🔻)	65.0	77.03

iamzieun / Boostcamp-Lv2-ODQA

Open-Domain Question Answering

일정 Schedule

대회 플랫폼 Platform

팀 Team

랩업리포트 Wrap-up Report

저장소 구조 Repository Structure

사용법 Usage

train

inference

평가 방법 Evaluation Metric

대회 결과

About

Languages