kmoonn / OuYuan-DemoSystem

服务外包大赛 耦缘 智能家居场景说话人识别演示系统

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

OUYUAN-DEMO(智能家居场景说话人识别演示系统)V1.0

智能家居场景说话人识别演示系统 耦缘-**大学生服务外包创新创业大赛——A03赛题演示系统 E-mail:hushan@kmoon.fun Updated on 2023.4.8

一、背景说明 说话人识别——生物特征识别技术 说话人语音信号接收——>处理——>分析——>提取——>(自动)确定说话人是否在目标集合里——>确定具体某个人

使用场景:语音助手、安防、车载、家居、机器人

**移动(浙江)创新研究院 北京希尔贝壳科技有限公司 本命题围绕产品跨设备、多距离的声纹识别技术实践为目标,挑战解决实际产品问题。

二、项目说明

  • 问题: 同一说话人在不同时间和口音状态下的语音特征,收音设备的差异、背景噪声、距离等因素都会影响说话人识别的结果
  • 用户期望 利用深度学习等相关算法解决说话人识别中的两大问题:
  1. 跨设备问题
  2. 近远讲问题

三、任务要求 - 开发说明 数据集: 希尔贝壳AISHELL-WakeUp-1数据库的子集HI-MIA数据集 HI-MIA数据集覆盖近讲麦克风和距离说话人前方1米、3米、5米的麦克风数据(近远讲)

  • 技术要求与指标 模型训练仅限于赛事提供的数据集 在指定平台上完成说话人识别系统的搭建与优化——九天毕昇平台

完成以下两个赛道中至少一个赛道的结果提交:

解释: 注册语音:即入库集合说话人语音数据 测试语音:即待被识别测试数据

  • 提交材料
  1. 项目概要介绍
  2. 项目简要PPT
  3. 项目详细方案
  4. 项目演示视频
  5. 企业要求提交的材料 需要借助九天毕昇人工智能平台完成作品 6. 团队自愿提交的其他补充材料
  • 任务清单
  1. 分析结果数据情况
  2. 完成所选赛道的系统搭建
  • 开发工具与数据接口 平台为指定的在线实验平台

image

About

服务外包大赛 耦缘 智能家居场景说话人识别演示系统


Languages

Language:CSS 59.7%Language:JavaScript 37.5%Language:HTML 2.2%Language:Python 0.6%