KLUE-benchmark / KLUE

📖 Korean NLU Benchmark

Home Page:https://klue-benchmark.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

[KLUE-YNAT] (TC)에서 dev 셋이 누락되었습니다

singleheart opened this issue · comments

Description

안녕하세요, https://klue-benchmark.com/tasks/66/data/description 표를 보면 YNAT에는 train, dev, test 셋이 있는데요,
https://klue-benchmark.com/tasks/66/data/download에서 https://aistages-prod-server-public.s3.amazonaws.com/app/Competitions/000066/data/ynat-v1.1.tar.gz 파일을 받아서 압축을 풀어 보면 ynat-v1.1_dev.json이라는 파일이 있는데, 개수를 세어 보면 위 표의 test셋과 개수가 같습니다. 표를 수정해야 할 것 같습니다.

#38 (comment) 코멘트를 보면 오버피팅을 방지하기 위해 테스트셋을 공개하지 않는다고 하셨네요. 이 정책은 이해했습니다. 그렇다면 현재 공개된 데이터셋이 dev셋이고 test셋이 비공개이니, https://klue-benchmark.com/tasks/66/data/description 표에서 dev와 test 열의 데이터 분량을 맞바꾸어 주어야 하겠습니다

안녕하세요. YNOT 팀장 송영숙입니다. 먼저, 꼼꼼히 살피고 오류를 찾아 주셔서 감사합니다. 확인해 보니 말씀하신 것과 같이 train, dev, test 세트 분할과 공개에는 문제가 없었으나 기록하는 과정에서 dev, test의 클래스 숫자를 바꾸어 적은 문제가 있었던 것 같습니다. 이후 업데이터 할 때 반영하도록 하겠습니다. 감사합니다.

class