您好、欢迎来到现金彩票网!
当前位置:秒速快三 > 数据集 >

谷歌的Tensorflow团队为DIY AI开源语音识别数据集

发布时间:2019-07-03 04:58 来源:未知 编辑:admin

  谷歌研究人员今天开源了一个数据集,为那些对人工智能感兴趣的DIY制造商提供更多工具,为一系列智能设备创建基本的语音命令。Speech Commands数据集由Google 的TensorFlow和AIY团队创建,汇集了65,000个30字的话语,用于AI模型的训练和推理。

  AIY Projects 于5月推出,旨在为那些想要修补AI的自助式制造商提供支持。该计划计划推出一系列参考设计,并开始使用语音识别和智能扬声器,您可以在纸板箱中制作。

  “我们用于创建数据的基础设施也是 开源的,我们希望看到更广泛的社区使用它来创建自己的版本,特别是覆盖服务不足的语言和应用程序,”Google Brain软件工程师Pete Warden写道博客文章今天。

  Warden表示,谷歌希望随着时间的推移,与该项目分享更多的口音和变化,以扩大数据集,使其超越数千人已经做出的贡献。与其他数据集不同,您实际上可以将语音添加到语音命令中。访问AIY Projects网站的演讲部分, 您将被邀请提供135个简单单词的短片,如“鸟”,“停止”或“去”,以及一系列数字和名称。

  Warden说,使用Speech Commands数据集训练的一些模型可能还不了解每个用户的声音,因为到目前为止,项目收集的语音样本中没有很好地表示某些组。

  斯坦福大学人工智能研究人员上个月发表的一项研究发现,使用Twitter和Urban Dictionary等方法训练的名为Equilid的语言标识符NLP比使用文本训练的标识符更准确,这些标识符可以根据年龄,种族或他们的方式排除某些用户自然而然地说,初步结果发现Equilid比谷歌的CLD2更准确 。语音识别工具的其他学术测试也发现流行的NLP工具难以理解非洲裔美国用户。

http://harpoolbrothers.com/shujuji/585.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有