mova-institute / zoloto

розмічений руками морфо’, синт’, кореф’ корпус української мови

Home Page:https://mova.institute/золотий_стандарт

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Робоче репо золотого корпусу. Звідси скриптами будуються українські Universal Dependencies.
Використовуйте 👉збудовану версію, викладену на UD: вона має стандартний стабільний формат. Працюйте над створенням золота — тутечки.


екосистема

  1. машинка (морфо-анотатор)
    1. статистика (наперед треба увійти в анотатор)
  2. NoSketch Engine (корпусний рушій)
  3. синт
    1. brat (синтакс-анотатор)
    2. можливо-помилки в робочій версії
    3. дірки в робочій версії
    4. conllu робочої версії
    5. Turku (синтакс-пошук):
      1. наш
      2. фінський
    6. UD
      1. гітхаб-репо нашого трібанку
        1. стабільна гілка
        2. робоча гілка
      2. що нового
      3. наші питання в UD
        1. відкриті
        2. закриті
      4. репорт валідатора всіх мов
      5. репорт валідатора наш
      6. архів розсилки
  4. Intertext (вирівнювач паралельних корпусів)
  5. документація
    1. специфікація позначок
  6. іш’юзи
  7. гуглдоки
    1. протокол морфологічного розмічування
    2. підручник зі синтакс розмічування
    3. роботи над помилками / старі „як це позначати“
    4. інструкція з кореференції
  8. mova.institute (титульний сайт)
    1. сторінка про цей корпус
    2. демо аналізатора

About

розмічений руками морфо’, синт’, кореф’ корпус української мови

https://mova.institute/золотий_стандарт