linuxsir首页 LinuxSir.Org | Linux、BSD、Solaris、Unix | 开源传万世,因有我参与欢迎您!
网站首页 | 设为首页 | 加入收藏
您所在的位置:主页 > 小企鹅新闻图书馆 >

Common Voice

时间:2019-03-03  来源:未知  作者:admin666

Common Voice 项目是 Mozilla 发起的倡议,旨在帮助教会机器真人的说话方式。昨天发布了最大的人类语音公共数据集,称为Common Voice。该数据集由18种不同的语言(包括英语,法语,德语,普通话,威尔士语,卡比尔等)组成七星彩走势图,并增加了来自42000多名贡献者的约1,00小时录制的语音片段。

Mozilla团队表示: 在这个版本中,不断增长的Common Voice数据集现在是同类中最大的,有成千上万的人将他们的声音和最初写的句子贡献给公共领域(CC0) 。

Common Voice数据集独特且丰富多样,因为它代表了语音贡献者的全球社区。这些贡献者还可以选择提供其他信息,如年龄,性别和口音,以便他们的语音剪辑附加到训练语音引擎有用的数据。

Mozilla在2018年6月启用了多语言支持,使Common Voice更具全球性和包容性。 Mozilla还涉及为该项目做出贡献的不同社区,他们帮助以22种不同语言开展数据收集工作,并在共同语音网站上开展了70多项正在进行的工作。

在这些社区的帮助下,Mozilla对Common Voice数据集进行了最新增加,包括荷兰语,Hakha-Chin,世界语,波斯语,巴斯克语和西班牙语等语言。它还计划继续与这些社区合作,以保持所代表的声音的多样性。根据Mozilla团队的说法,这些公共贡献者不仅能够跟踪记录和验证中每种语言的进度,还改进了不同剪辑的提示。

Mozilla还添加了一个新选项来创建保存的配置文件,这有助于贡献者跟踪他们在不同语言中的进度和指标。它还提供可选的人口统计资料信息,进一步帮助改善用于训练语音识别准确性的音频数据。

除数据集外,Mozilla还致力于在未来为更多样化和创新的语音技术生态系统做出贡献。它旨在发布支持语音的产品,同时确保支持研究人员和小型企业。

对于Common Voice,我们在2018年的重点是构建这个概念,使其成为任何语言社区使用,优化网站和构建强大后端的工具。我们的总体目标仍然是:为寻求构建和使用语音技术的世界上每个人提供更多更好的数据, Mozilla团队表示。

有关此公告的更多信息,请查看官方Mozilla博客文章。

Linux公社的RSS地址:https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址:https://www.linuxidc.com/Linux/2019-03/157214.htm

linux Wireshark 3.0.0 发布,开源和跨平台网络协议分析软件 fanotify API在Linux 5.1内核中变得更加有用
友情链接