语音合成方面,还有比科大讯飞更牛的么?

论坛 期权论坛 期权     
匿名用户1024   2021-5-14 18:10   6848   5
试了一下科大讯飞、百度、云知声的语音合成,发现科大讯飞的语音合成太牛了,有些已经和真人差不多了,而百度和云知声的听起来还是有些别扭,还有没有哪家公司的语音合成能与科大讯飞媲美呢?
分享到 :
0 人收藏

5 个回复

倒序浏览
2#
有关回应  16级独孤 | 2021-5-14 18:10:57
有的,可以听听微信小程序-配音家,效果比科大讯飞要好太多了。
点击【配音家】,或者微信搜索“配音家”,打开即可使用。
金牌配音员有24k超高清音质,支持选择高兴、难过等情绪,超像真人:
[/url]来源 [url=https://www.zhihu.com/people/9f5518efbf7edaaa5ea84292b2b1b78a]@配音之家
3#
有关回应  16级独孤 | 2021-5-14 18:10:58
当然是谷歌最近发布的Tacotron 2合成引擎,效果比之前的WaveNet有进一步的提升。
以下是介绍链接
Audio samples from "Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions"
你可以去听一听里面的示例音频,基本上听不出这是电脑生成的
4#
有关回应  16级独孤 | 2021-5-14 18:10:59
2021年3月21日,win10 更新后 Edge 浏览器里的语音朗读(ctrl+shift+ u)惊到了我。
之前我用过微软的大声朗读,也用过他的其他语音引擎,比如说废掉之前的小娜。相比之下还是讯飞的语音表现更好,手机上我常用就是讯飞阅读,被废掉以后用了讯飞有声。
但是今天我用了一下新本的 Edge 中的 xiaoxiao ,确实进步太大了。暂时他会是我的首选。
更新 win10 系统之后打开 Edge ,网页里选中文本右键就可以朗读了(直接空白处右键或者快捷键是全页面朗读),也可以把txt文件拖进去以后进行朗读。
……………
之前手机版上有个讯飞阅读,里面有几个男播音员非常棒,后来改成了 小说火火 ,也还不错。但是这两个都被废掉了,现在只能选择 讯飞有声,那几个好听的男播音配音也被撤下来了,现在用的多的是小佩,0.7x 速,然后选一个舒缓的钢琴背景音乐,下面自带的有选项。

用在线的,音频声音密度更好更自然,但是免费用户每天有时长限制,所以我现在使用的是离线流畅语音。倒是够用了,这个 app 挺良心的。复制链接或者在APP内部发送到他,都可以快速的朗读,极大解放了我的颈椎和眼睛。不仅支持复制文本和链接朗读,还可以导入txt、图文版的PDF和EPUB文件进行朗读。
今年的 Edge 目前只能支持网页和拖入 txt,其他的文件格式如 epub 等不行。
5#
有关回应  16级独孤 | 2021-5-14 18:11:00
如果从参加Blizzard Challenge大赛的结果来讲,讯飞独占鳌头,毋庸置疑。
但无冕之王也是有的,Tacotron2就很有前途,而且只要你有时间,有数个小时左右的单发音人语音数据和对应的文本,你也可以做到很好。
目前最容易实现的方法是基于attention的End-to-End的方法:输入字符序列,经过一系列LSTM或者CNN进行Encode,然后使用Attention来处理输入/输出非等长序列的Decode(这个过程可以看做DTW),生成vocoder的输入数据(各种谱或者谱包络特征),再通过vocoder就可以重建语音波形了(目前音质最好的vocoder应该是sampleRNN、wavenet一类的预测模型)。
其中的关键在于attention,不然的话就得把模型做成输入输出序列等长的结构,需要预先处理文本和语音时间点的对应(forcealignment),而且这个过程引入了额外的误差。
当然了,这种简单粗暴的字符映射会丢掉很多语义信息,导致合成的语音语调平稳,没有色彩,就算加入ToBI,使用了一定的语义信息,但也还是欠缺太多。这个问题就难解了,目前还没有人做到,因为NLP也并没有根本上的突破。
6#
有关回应  16级独孤 | 2021-5-14 18:11:01
当然有啦,比如微信上的“百宝音”小程序,是个支持在线文字转语音的配音软件,功能强大,制作出来的声音效果非常好,没有机械声,24k高音质,媲美真人!
百宝音配音神器话不多说,先来看看这段视频体验下效果!
[url=https://www.zhihu.com/zvideo/1331188962472886272][/url]怎样,配音效果好吧,不仅有感情,在细节的处理上也非常到位,如果不是专业人士都分不清是语音合成的。
[h1]具体有多好,请看!!![/h1][h1]优点1:操作简单[/h1]无需太技术操作,只需将之前准备好的文字导入到文本框,挑选配音员,调节语速和语调,一键语音合成即可。



[h1]优点2:主播声音丰富多样[/h1]例如甜美的女声,成熟的男声,可爱的童声,标准的外语,有特色的方言等应有尽有,选择空间大!



[h1]优点3:支持给视频变声[/h1]适合视频二次混剪,可以快速把视频素材上传到软件上,一键提取视频字幕,然后重新给视频配音,操作跟优点1一样。



[h1]优点4:支持一键智能原创[/h1]将原有的文案进行二次创作,拯救没灵感,不知道怎么写文案的小可爱们,同时,还能避免后期带来不必要的原创问题。



[h1]优点5:干货分享[/h1]发现页面里有很多视频配音干货,副业赚钱干货分享,帮助刚入行的小白迅速上手。



[h1]优点6:收费优惠,甚至免费[/h1]免费的音色每天都可以使用,部分有特色的高级音色每天有三次免费使用的机会,之后按月收费,无限次使用,不限配音员,比市面上其他的价格便宜且质量好!



[h1]优点7:它不占用内存[/h1]现在大多数人的手机内存严重不足。“百宝音”在微信小程序跟电脑网页端都能使用,根本不占用内存,非常的贴心,使用起来也非常方便,看个人需求!

想要给视频或文本配音的小伙伴们可以试试哟,方便又实用!!!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:136515
帖子:27303
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP