设为首页
点击收藏
手机版

手机扫一扫访问
迪恩网络手机版
关注官方公众号

微信扫一扫关注
迪恩网络公众号

登陆注册

快速发帖
客服电话

点击联系客服
在线时间：8:00-16:00

客服电话

132-9538-2358

电子邮件
[email protected]
APP下载

迪恩网络APP

随时随地掌握行业动态
官方微信

扫描二维码

关注迪恩网络微信公众号
问题反馈
返回顶部

OGeek|极客世界-中国程序员成长平台 › 门户 › 开源›应用工具

GeekPwnTTS: This is src code of textToSpeech.

原作者: [db:作者] 来自: 网络收藏邀请

开源软件名称：

GeekPwnTTS

开源软件地址：

https://gitee.com/ko-orz/GeekPwnTTS

开源软件介绍：

GeekPwnTTS

This is src code of textToSpeech.

https://gitee.com/ko-orz/GeekPwnTTS/

用法说明

util中的splitWav&silentWav.js可以做到切分原始语音，变成多个语音片段；
util中的pinYinUtil.js可以提取中文的拼音；
util中的getPinYinCount.js可以判断音节归档的完成度；
textToSpeech.js生成语音文件

技术说明

语音去噪

判断语音数据中是否有连续的低于阈值的部分；
有就直接将这部分声音置零；

语音分割

将停顿点作为语音分割点；
将语音切割为多个语音片段；

语音平滑处理

找到语音片段的开头波段和结尾波段；
判断波段是否在0附近，不在的话，剔除改周期，直到下周起的0值；
这样处理以后，就不会出现波段不平滑，周期不自然的情况；

音节识别（未实现）

将切好的语音与预设的语音作比较；
相似度高则判定通过；
需要通过HMM(Hidden Markov Model)/GMM(Gaussian Mixture Model)等的知识；
需要训练音节模型；

归档音节

自动归档识别好的音节；
不仅是音节，还要做好整字，整词，整句的归档，提高可识别度；
本处直接采用了人工归档，就是一个一个听，然后右键保存啦O(∩_∩)O;

录音器材猜想（未实现）

通过直接录取不同频率的声音，建模会更好处理，因为现在的录音设备是把不同频率混在一起了，很难分离；
该录音器可以参考人的耳蜗，是旋涡形状的，越到内部识别越高频率的声音，越外面识别月低评率的声音；

切词,产生顿挫感觉

导入大量网络文本资源；
建立一个字典，把文字循环丢入字典中；
直接将出现次数最多的组合作为一个词；
出现较少的可以通过TFIDF算法来提升这个词的权重；
项目还未完善，本处直接使用了jieba切词；

参考资料

该文章已有0人参与评论

请发表评论

全部评论

专题导读

上一篇：

VideoConverter: 视频格式转换发布时间：2022-03-25

下一篇：

Cloud-Sms: 短信云轰炸，可以用于离线轰炸骗子手机号发布时间：2022-03-25

热门推荐

热门话题

阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服（服务时间 9:00～18:00）

在线QQ客服

地址：深圳市南山区西丽大学城创智工业园

电邮：jeky_zhao#qq.com

移动电话：139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap