• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

GeekPwnTTS: This is src code of textToSpeech.

原作者: [db:作者] 来自: 网络 收藏 邀请

开源软件名称:

GeekPwnTTS

开源软件地址:

https://gitee.com/ko-orz/GeekPwnTTS

开源软件介绍:

GeekPwnTTS

This is src code of textToSpeech.

https://gitee.com/ko-orz/GeekPwnTTS/

用法说明

  1. util中的splitWav&silentWav.js可以做到切分原始语音,变成多个语音片段;
  2. util中的pinYinUtil.js可以提取中文的拼音;
  3. util中的getPinYinCount.js可以判断音节归档的完成度;
  4. textToSpeech.js生成语音文件

技术说明

语音去噪

  1. 判断语音数据中是否有连续的低于阈值的部分;
  2. 有就直接将这部分声音置零;

语音分割

  1. 将停顿点作为语音分割点;
  2. 将语音切割为多个语音片段;

语音平滑处理

  1. 找到语音片段的开头波段和结尾波段;
  2. 判断波段是否在0附近,不在的话,剔除改周期,直到下周起的0值;
  3. 这样处理以后,就不会出现波段不平滑,周期不自然的情况;

音节识别(未实现)

  1. 将切好的语音与预设的语音作比较;
  2. 相似度高则判定通过;
  3. 需要通过HMM(Hidden Markov Model)/GMM(Gaussian Mixture Model)等的知识;
  4. 需要训练音节模型;

归档音节

  1. 自动归档识别好的音节;
  2. 不仅是音节,还要做好整字,整词,整句的归档,提高可识别度;
  3. 本处直接采用了人工归档,就是一个一个听,然后右键保存啦O(∩_∩)O;

录音器材猜想(未实现)

  1. 通过直接录取不同频率的声音,建模会更好处理,因为现在的录音设备是把不同频率混在一起了,很难分离;
  2. 该录音器可以参考人的耳蜗,是旋涡形状的,越到内部识别越高频率的声音,越外面识别月低评率的声音;

切词,产生顿挫感觉

  1. 导入大量网络文本资源;
  2. 建立一个字典,把文字循环丢入字典中;
  3. 直接将出现次数最多的组合作为一个词;
  4. 出现较少的可以通过TFIDF算法来提升这个词的权重;
  5. 项目还未完善,本处直接使用了jieba切词;

参考资料

  1. 声纹鉴定能否鉴定经过变声器的声音?
  2. 什么是共振峰?
  3. 音频特征提取————常用音频特征
  4. 理解快速傅里叶变换(FFT)算法
  5. 用最简单的方式实现FFT
  6. Notes on the FFT
  7. FFT算法介绍
  8. 视音频数据处理入门
  9. 声纹识别特征的特征参数提取
  10. 中国汉子有多少个发音?
  11. 国语拼音对照表
  12. wav格式解析
  13. 世界上十个最伟大的公式

鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
VideoConverter: 视频格式转换发布时间:2022-03-25
下一篇:
Cloud-Sms: 短信云轰炸,可以用于离线轰炸骗子手机号发布时间:2022-03-25
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap