语音SDK

语音录制、播放模块

支持基于Media和Audio的语音录制和播放。
支持基于PCM的格式扩展操作
提供js调用demo

功能类别

语音录制
1. 支持字节数组（pcm格式）的实时数据输出，用以实时解析音频数据
2. 支持Android直接录制格式：PCM16，PCM8，AMR等
3. 支持基于原始音频格式的包装扩展格式，目前支持WAV
4. Audio录制支持采样频率、通道等参数的自定义
5. Media录制支持自定义编码格式
6. H5接入语音功能示例 https://github.com/liyuzero/MaeVoice/blob/master/h5.md
语音播放
- 支持PCM，AMR，WAV等格式的播放

使用方法

新增依赖

allprojects {
    repositories {
        google()
        jcenter()
        maven { url "https://jitpack.io" }
    }
}

使用module依赖，新增依赖：

compile 'com.github.liyuzero:MaeBundlesVoice:1.0.0'

具体调用（详情见demo）

录音使用方法

    RecordAPI recordAPI = VoiceManager.with(activity).getRecordAPI(VoiceType.PCM_16BIT);
    /* 添加录制参数
    RecordAPI recordAPI = VoiceManager.with(activity).getRecordAPI(VoiceType.PCM_16BIT,
            new AudioRecordParam(16000, AudioRecordParam.AudioInChannel.CHANNEL_IN_MONO));*/
    // 开始录制：outputPath：String 音频录制输出文件路径
    recordAPI.startRecord(outputPath, new RecordListener() {
    						@Override
    						public void onStart() {
    						}
    						@Override
    						public void onFinishRecord(long duration, String filePath) {
    							Toast.makeText(getApplicationContext(), "录音结束,时长： " + duration, Toast.LENGTH_SHORT).show();
    						}

    						@Override
    						public void onCancel() {
    						}

    						@Override
    						public void onError(Exception e) {
    							Toast.makeText(getApplicationContext(), "出错啦 " + e.getMessage(), Toast.LENGTH_SHORT).show();
    						}
    						@Override
    						public void onAmplitudeChanged(int volume) {
    						}
    					});

    //停止并完成录制
    recordAPI.stopRecord();
    //检查是否正在录制
    //recordAPI.isRecording();
    //取消录制
    //recordAPI.cancelRecord();
    //释放资源
    //recordAPI.release();

播放音频使用方法

	PlayerAPI playerAPI = VoiceManager.with(activity).getPlayerAPI(VoiceType.PCM_16BIT);
	//自定义播放参数【只有Audio需要且可以自定义参数】
	/*playerAPI = VoiceManager.with(activity).getPlayerAPI(VoiceType.PCM_16BIT,
	    new AudioPlayParam(16000, AudioRecordParam.AudioInChannel.CHANNEL_IN_MONO));*/
	//originPath：String 音频文件路径
	playerAPI.startPlay(originPath, new PlayListener() {
		@Override
		public void onStart() {
		}
		@Override
		public void onStop() {
		}
		@Override
		public void onError(Exception e) {
		}
	});

	//停止播放
	playerAPI.stopPlay();
	//是否正在播放
    playerAPI.isPlaying();
    //释放资源
    playerAPI.release();

自定义PCM文件扩展，即提供基于PCM原始文件的文件转换能力

        AudioRecordParam param = DefaultParam.getDefaultAudioRecordParam());
        param.setPcmFileConverter(new WavRecordUtils()); //改成你自己的基于BaseAudioRecordExtendUtils的实现类
        
        /*
         * 文件转换类自行实现文件转换方法,具体实现参考WavRecordUtils
            public class TestFileConvater extends BaseAudioRecordExtendUtils {
                
                public TestFileConvater(VoiceType voiceType, AudioRecordParam audioParam) {
                    super(voiceType, audioParam);
                }
            
                @Override
                //设置临时文件的名字，对应于originFilePath
                protected String getTempFileName() {
                    return null;
                }
            
                //将生成的PCM文件originFilePath：自行转换为outputFilePath所对应的文件，outputFilePath对应于外界指定的文件录音地址
                @Override
                protected String transform(String originFilePath, String outputFilePath) {
                    return null;
                }
            }
         *
         */
        
        recordAPI = VoiceManager.with(RecordNativeTestActivity.this).getRecordAPI(VoiceType.WAV, param);

4、字节数组的实时数据输出，用以实时解析音频数据，（字节数组为原始pcm流）

    /*
      而只进行录音的PCM原始字节数组的实时传出（字节数组内部进行了一次复制传出，避免了多线程下数据错乱的问题）
      即：只调用 onRecordBytes(byte[] audioData, int len, int audioSeq)，而不进行文件写入
    
      该功能能有效支持以下应用场景：
    
      例如我们需要做一个语音转文字功能，或者聊天时将语音发给对方，这时候如果采用录制完后，再将所有语音数据传输给后台，
      将会出现较大的响应延迟，客户端需要经过一个较长的时间才能取得结果。这时候如果不录制文件，而直接通过onRecordBytes
      接收每一帧音频数据直接发送到服务端，实现实时传输，这时候效果会好很多
    */
    
    AudioRecordParam param = DefaultParam.getDefaultAudioRecordParam());
    
    /*
      byte[] audioData【每次通过麦克风采集的录音数据】的数组大小可以通过以下配置自行控制，因为一些语音数据压缩库可能对源字节数组的大小有限制，
      例如opus，会有：
      频率 * 位数 * 通道数 / 位 = B/s /(200ms / 1000ms) = B/200ms
    */
    
    bufferLen = getSampleRate() * 16 * 1 / 8 / 5;
    param.bufferLen = 14000;
    
    /*
      当配置以下参数时，库内部将不再执行文件写入操作，而只会调用
      onRecordBytes(byte[] audioData, int len, int audioSeq) 
      和 onFinishRecord(long duration, String filePath)，其中filePath无意义
    */
    param.setIsOutputFile(false); //不输出录音文件

释放麦克风等资源的方法

   VoiceManager.getInstance().onDestroy();

liyuzero / MaeVoice

语音SDK

功能类别

使用方法

新增依赖

具体调用（详情见demo）

About

Languages