Этим летом я начал изучать японский язык. Чтобы делать это максимально продуктивно, я решил создать flashcards (индексные карточки) для программы Anki (computer learning assistant), код, который использовался для генерации данных для этих карточек, лежит тут.
При создания карточек были использованы:
- Параллельные предложения из корпуса Tatoeba на японском, русском и английском языках
- Данные о кандзи (японских иероглифах) из проекта Kanji alive — переводы на английский и примеры использования
- Сведения о кандзи и их радикалах из проекта KanjiDIC2, а также переводы на английский
- Морфологический анализатор японского текста MeCab
- Переводы кандзи на русский с сайта nippon.temerov.org
А вот пример результата: