bytecell / slotminer

Tool for slot extraction from text

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

상대적인 시간정보 표현을 위한 schema 설계

bytecell opened this issue · comments

기존의 ISO-TimeML 기반으로 설계되었던 korean TimeML 은 상대적인 시간정보를 효과적으로 담아낼 수 없다.

상대적인 시간정보를 담아낼 수 있는 schema 를 설계하도록 한다.

현재의 버전은 아래와 같다.

attributes ::= type text extent calendar [year] [month] [day] [week] [week_day] [mod] 
type ::= 'DATE' | 'TIME' | 'DURATION'
text ::= CDATA
extent ::= [(begin, end), ...]
begin ::= CDATA {begin ::= <integer>}
end ::= CDATA {end ::= <integer>}
calendar ::= 'GREGORIAN' | 'LUNAR' | 'JULIAN'
year ::= mark CDATA
month ::= mark CDATA
day ::= mark CDATA
hour ::= mark CDATA
minute ::= mark CDATA
second ::= mark CDATA
week ::= mark CDATA
week_day ::= 0 | 1 | 2 | 3 | 4 | 5 | 6
mark ::= 'P' | '+' | '-' | '_' (Note: '_''기원전' 표현 전용)
mod ::= 'START' | 'MID' | 'END' | 'START_MID' | 'MID_END'

앞으로 수개월동안, 위 버전의 schame 가 다루지 못하는 경우를 발견하여 지속적으로 schama를 개선하도록 한다.