KwangryeolPark / DGM.Project.Group25

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

결과_음성데이터_구성_설명서

음성 데이터 구성 설명

예시 파일 명: A_B_C_D.wav

A: {대본문장, 비대본문장}   
	-> 대본문장: 학습에 사용된 음성 데이터를 구성하는 문장을 Output으로 생성하였습니다.
	-> 비대본문장: 학습에 사용되지 않은 문장을 Output으로 생성하였습니다.

B: {원본, 생성}
	-> 원본: 구음장애 화자가 직접 발화한 데이터
	-> 생성: 원본 데이터를 사용하여 출력한 Output 음성 데이터

C: {긴문장, 짧은문장, 실패}
	-> 긴문장: 일정개수 이상의 단어가 사용된 문장
	-> 짧은문장: 일정개수 미만으로 단어가 사용된 문장
	-> 실패: 적절히 음성이 생성되지 않은 경우의 데이터

D: {음성 데이터를 구성한 대본의 대표 단어}
	<62세 남자>
	나무	: 나무 아래 풀밭에는 메뚜기가 있습니다.
	음운론	: 음운론을 가르치시던 담임선생님은 흙에서 넓죽한 고구마를 캐셨다.
	물	: 물이 차다.
	찌개	: 짜게 끓인 찌개는 맛있다.
	행복	: 행복한 하루 되세요.
	배	: 배가 아프다.
	코끼리	: 코끼리는 코가 길다.
	호랑이	: 꼬리를 늘어뜨리고 있는 호랑이에게 땅콩을 줬습니다.
	

	<70세 여자>: 오늘처럼 눈이 오는 날은 조심해서 운전해야한다. 
	영화	: 영화는 언제 시작합니까?
	찌개	: 짜게 끓인 찌개를 쭈그려 앉아서 먹었다.
	행복	: 행복한 하루 되세요.
	배	: 배가 아프다.
	호랑이	: 꼬리를 늘어뜨리고 있는 호랑이에게 땅콩을 줬습니다.
	모델	: 생성모델은 어려우면서도 재미있다.

파일 설명

Graduate.openspeech: Speech-to-Text model, LAS model을 구동할 수 있는 openspeech framework tacotron2: Text to Mel-spectrogram model waveglow: Mel-spectrogram model voice_conversion: MaskCycleGAN model

About


Languages

Language:HTML 74.2%Language:Python 20.4%Language:Jupyter Notebook 5.2%Language:Shell 0.2%Language:Batchfile 0.0%Language:Makefile 0.0%Language:Dockerfile 0.0%