예시 파일 명: A_B_C_D.wav
A: {대본문장, 비대본문장}
-> 대본문장: 학습에 사용된 음성 데이터를 구성하는 문장을 Output으로 생성하였습니다.
-> 비대본문장: 학습에 사용되지 않은 문장을 Output으로 생성하였습니다.
B: {원본, 생성}
-> 원본: 구음장애 화자가 직접 발화한 데이터
-> 생성: 원본 데이터를 사용하여 출력한 Output 음성 데이터
C: {긴문장, 짧은문장, 실패}
-> 긴문장: 일정개수 이상의 단어가 사용된 문장
-> 짧은문장: 일정개수 미만으로 단어가 사용된 문장
-> 실패: 적절히 음성이 생성되지 않은 경우의 데이터
D: {음성 데이터를 구성한 대본의 대표 단어}
<62세 남자>
나무 : 나무 아래 풀밭에는 메뚜기가 있습니다.
음운론 : 음운론을 가르치시던 담임선생님은 흙에서 넓죽한 고구마를 캐셨다.
물 : 물이 차다.
찌개 : 짜게 끓인 찌개는 맛있다.
행복 : 행복한 하루 되세요.
배 : 배가 아프다.
코끼리 : 코끼리는 코가 길다.
호랑이 : 꼬리를 늘어뜨리고 있는 호랑이에게 땅콩을 줬습니다.
<70세 여자>
눈 : 오늘처럼 눈이 오는 날은 조심해서 운전해야한다.
영화 : 영화는 언제 시작합니까?
찌개 : 짜게 끓인 찌개를 쭈그려 앉아서 먹었다.
행복 : 행복한 하루 되세요.
배 : 배가 아프다.
호랑이 : 꼬리를 늘어뜨리고 있는 호랑이에게 땅콩을 줬습니다.
모델 : 생성모델은 어려우면서도 재미있다.
Graduate.openspeech: Speech-to-Text model, LAS model을 구동할 수 있는 openspeech framework tacotron2: Text to Mel-spectrogram model waveglow: Mel-spectrogram model voice_conversion: MaskCycleGAN model