纯PyTorch语音工具包SpeechBrain开源免费获取

      2021-3-17 15:54| 发布者: admin| 查看: 34| 评论: 0

      摘要: 间距MircoRavanelli公布打造出新的语音工具包过去一年多,SpeechBrain确实如期而至。语音解决技术性的发展,是人工智能技术更改大家的日常生活的重要一环。深度神经网络技术性的盛行,也让这一行业近些年获得了长久 ...
      间距MircoRavanelli公布打造出新的语音工具包过去一年多,SpeechBrain确实如期而至。
      语音解决技术性的发展,是人工智能技术更改大家的日常生活的重要一环。深度神经网络技术性的盛行,也让这一行业近些年获得了长久的发展趋势。在往日,该行业的关键方式是为不一样的每日任务开发设计不一样的工具包,针对使用人而言,学习培训每个工具包必须很多時间,还很有可能牵涉到学习培训不一样的计算机语言,了解不一样的编码设计风格和规范等。如今,这种每日任务大多数可以用深度神经网络技术性来完成。

      先前,开发人员常见的语音工具有Kaldi、ESPNet、CMUSphinx、HTK等,他们都有各的存在的不足。以Kaldi为例子,它依靠很多的开发语言,并且关键优化算法应用C++撰写,再再加上很有可能必须更改各种各样神经元网络的构造。就算是有着丰富多彩工作经验的技术工程师,在调节的情况下也会历经极大的痛楚。
      秉持着让语音开发人员更轻轻松松的标准,YoshuaBengio精英团队组员MircoRavanelli等以前开发设计了一个尝试承继Kaldi的高效率和PyTorch的协调能力的开源架构——,但据开发设计组员自己觉得「还不够健全」。
      因此 ,在一年多前,MircoRavanelli公布要打造出一款新的一体化语音工具包SpeechBrain。该新项目于近日宣布开源,由于所述情况,SpeechBrain问世的关键服务宗旨是:够简易、够灵便、对客户友善。
      新项目详细地址:https://github.com/speechbrain/speechbrain
      做为一个根据PyTorch的开源一体化语音工具包,SpeechBrain可用以开发设计全新的语音技术性,包含语音鉴别、讲话者鉴别、语音提高、多话筒信号分析和语音识别技术等,且有着非常优异的特性。精英团队将其特点概述为「便于应用」、「便于订制」、「灵便」、「模块化设计」等。
      针对深度学习学者而言,SpeechBrain可轻轻松松置入别的实体模型,推动语音技术性的有关科学研究;针对新手而言,SpeechBrain也不会太难把握,依据检测,一般开发人员仅必须好多个钟头就能了解该工具包的应用。除此之外,开发设计精英团队也公布了许多 实例教程以仅供参考(https://speechbrain.github.io/tutorial_basics.html)。
      整体而言,SpeechBrain有下列几大闪光点:
      开发设计精英团队与HuggingFace集成化一些预训练模型,这种实体模型具有可运作逻辑推理的插口。假如HuggingFace实体模型不能用,精英团队会出示一个GoogleDrive文件夹名称,包括全部相匹配的试验結果;
      应用PyTorch数据信息并行处理或分布式系统数据信息并行处理来开展多GPU训炼和逻辑推理;
      混和精密度,加速训炼速率;
      全透明且彻底可自定的数据信息键入和輸出pipeline。SpeechBrain遵照PyTorch数据信息加载器和数据款式,使客户可以自定I/Opipeline。
      迅速安裝
      现阶段开发人员能够根据PyPI安裝SpeechBrain,除此之外还能够应用当地安裝来运作试验和改动/自定工具包。
      SpeechBrain适用根据Linux的发行版和macOS(且对于Windows客户也出示了相对解决方法:https://github.com/speechbrain/speechbrain/issues/512)。
      SpeechBrain适用CPU和GPU,但针对大部分recipe来讲,训炼期内务必应用GPU。必须留意的是,务必恰当安裝CUDA才可以应用GPU。
      使用教程详细地址:https://speechbrain.readthedocs.io/en/latest/installation.html
      根据PyPI安裝
      建立Python自然环境后,只需键入以下几点就可以:
      pip install speechbrain
      随后能够应用下列指令浏览SpeechBrain:
      import speechbrain as sb
      当地安裝
      建立Python自然环境后,只需键入以下几点就可以:
      gitclonehttps://github.com/speechbrain/speechbrain.gitcdspeechbrainpipinstall-rrequirements.txtpipinstall--editable.
      随后能够根据下列方法浏览SpeechBrain:
      import speechbrain as sb
      对speechbrain程序包所做的一切改动,将在安裝含有--editable标示的程序包时全自动表述。
      SpeechBrain未附归属于一切组织,精英团队组员来源于Mila研究室、Nuance、杜比实验室、英伟达显卡、三星、Viadialog等试验室和企业单位。最开始的俩位责任人是Mila研究室博士研究生MircoRavanelli和Avignon博士研究生TitouanParcollet。现阶段,Speechbrain新项目仍在健全中,也热烈欢迎大量开发者添加。
      见到这儿,Kaldi是否会觉得工作压力有点儿变大呢?
      入门实际操作:出航公司怎么才能搭建AI运用
      3月17日,亚马逊云高新科技深度学习产品运营李媛和亚马逊云高新科技深度学习商品技术专家王世帅将产生网上共享。此次共享将详细介绍怎样依靠AmazonRekognition完成客户身份核查、视频图片内容审核与依靠Amazon Personalize为客户出示智能推荐。

      鲜花

      握手

      雷人

      路过

      鸡蛋

      相关阅读

      QQ|Archiver|手机版|小黑屋|蓄财网 ( 豫ICP备2021002293号 )

      GMT+8, 2021-9-14 12:02 , Processed in 0.100449 second(s), 31 queries .

      蓄财网 ©版权所有

      © 2021 蓄财网(www.aixc.cn)

      返回顶部