她们网 > 情感百科 > speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国

speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国

日期:2023-02-22 22:34:17作者:图片:未知人气:+

5良好的开源语音识别/语音到文本系统20开源语音识别

它可能是历史上最古老的语音识别软件之一。它的发展始于1991年的京都大学,然后在2005年所有权转移给了一个独立的项目团队。

Julius的主要功能包括执行实时STT的能力、低内存占用(20,000个单词小于64 MB)、输出最佳单词N-最佳单词和单词图的能力以及作为服务器单元运行的能力。这个软件主要是为学术和研究机构设计的。用c语言编写,可以在Linux、Windows、macOS甚至Android(智能手机上)上运行。

目前只支持英语和日语。软件应该很容易从Linux发行仓库安装。在包裹管理器里搜索朱利叶斯。最新版本大概是这篇文章发表前的一个半月。

Wav2Letter++

5良好的开源语音识别/语音到文本系统22开源语音识别

如果你正在寻找一个更时尚的,那么这个一定会适合你。Wav2Letter++是两个月前Facebook的AI研究团队发布的开源语言识别软件。代码在BSD许可下发布。

Facebook将其图书馆描述为“最快、最先进的语音识别系统”。它的构建理念是默认情况下针对性能进行优化。Facebook最新的机器学习库手电筒(手电筒)也被用作Wav2Letter++的底层核心。

Wav2Letter++需要你为描述的语言建立一个模型来训练算法。没有任何语言(包括英语)的预培训模式。它只是一个用C++编写的机器学习驱动的文语转换工具,所以取名Wav2Letter++。

项目主页

深度速度2

5良好的开源语音识别/语音到文本系统24开源语音识别

中国软件巨头百度的研究人员也在开发他们自己的语音到文本转换引擎“深度语音2”。它是一个端到端的开源引擎,使用“PaddlePaddle”深度学习框架来转换英文或中文字符。代码在BSD许可下发布。

引擎可以在你想要的任何模型和任何语言上训练。模型没有随代码一起发布。你必须像其他软件一样建立自己的模型。DeepSpeech2的源代码是用Python写的,用过的话会很好用。

项目主页

总结

语音识别领域仍由专有软件巨头主导,如Google和IBM(为此提供闭源商业服务),但开源类似软件大有可为。这五个开源语音识别引擎应该能够帮助你构建应用,并且随着时间的推移会不断发展。几年后,我们希望开源能像其他行业一样,成为这些技术的规范。

如果您对列表有其他建议或意见,我们很乐意在下面听到。

本文由原创编辑,荣誉推出

标签:

本文标题:speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国 - 情感百科

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.chybbs.com.cn/baike/13683.html

投稿入口 | 网站地图

Copyright 2005-2021 www.chybbs.com.cn 【她们网】 版权所有 | 湘ICP备88888888号

声明: 部分信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,互联网不良信息举报邮箱:2877366609@qq.com