This repository is practice for Big Data and Information Retrieval class.
본 실습 자료는 BDC103(00) 빅데이터와정보검색 강의 실습을 위해
고려대학교 자연어처리연구실 (NLP & AI Lab) 에서 제작했습니다.
☠️ 학습 이외의 목적으로 무단 배포를 금지합니다. ☠️
@InclassProject{
year={2021},
title={BDC103_IR},
author={Jaehyung Seo,and Heuiseok Lim}
email={wolhalang@gmail.com}}
실습 4강: 추후 공개
실습 계획표(예정) |
---|
실습 1. Python 기본 문법 및 Colab 사용법 |
Colab Notebook에 대한 간단한 사용법 |
Python 입출력, 사칙연산, 조건문, 루프문 |
Colab과 Google Drive 연동 방법 |
실습 2. 정보 검색 |
TF-IDF 실습 |
BM25 실습 |
ElasticSearch 검색 엔진 + Python 연동 |
ElasticSearch 색인화 및 정보 검색 실습 |
중간고사 |
실습 3. 정보 검색 기반 질의 응답 |
사전 훈련된 BERT로 SQUAD 1.1 문제 해결 |
실습 4. 텀 프로젝트 가이드 |
Kaggle 사용법 및 리더보드 등록 방법 |
텀 프로젝트 진행 방법 설명 |