深度学习
如何解决神经网络训练时loss不下降的问题
当我们训练一个神经网络模型的时候,我们经常会遇到这样的一个头疼的问题,那就是,神经网络模型的loss值不下降,以致我们无法训练,或者无法得到一个效果较好的模型。 导致训练时loss不下降的原因有很多,而且,更普遍的来说,loss不下降一般分为三种,即:训练集上loss不下降,验证集上loss不下降,和测试集上loss不下降。
继续阅读一个IT科技爱好者,西安电子科技大学本科+硕士毕业,计算机专业科班,技术研发从业者 ,关注软件工程、人工智能、网络通信和云计算相关技术。
伴随着远方的星光与梦想,航行在新时代的计算机科技、互联网和人工智能的浪潮之中,爱科学技术,更爱生活。 希望能让世界因自己而不同,通过计算机信息通信技术,为改变我们的生活,贡献一己之力。
熟悉或掌握Go、Python、Java和C#/C/C++等编程语言,熟悉Linux、MySQL、Nginx、Docker等服务器常用软件,具备一定的软件需求分析和设计、建模能力
熟悉机器学习(深度学习)和语音识别技术,在GitHub和Gitee上开源了基于深度学习的ASRT语音识别系统
社交网络链接: GitHub主页 | Gitee主页 | Twitter | 知乎个人主页 | 知乎专栏 | Bilibili | 今日头条 | CSDN个人主页 | 元语音网个人主页
核心算法:基于一组DCNN-CTC结构的声学模型,使用Spectrogram(语谱图)作为声学特征,并通过N-Gram语言模型解码实现。
在基本安静的标准普通话场景下,可达到85%以上的识别率,单条语音片段的识别时间开销在1秒以内。
ASRT语音识别系统还提供了基于HTTP和gRPC协议的服务端API接口,以及由Golang、Python、C#和Java语言实现的客户端SDK,支持做二次开发,将算法成果落地实用。
ASRT项目主页 | ASRT项目文档 | GitHub项目仓库 | Gitee项目仓库 | C#客户端SDK仓库 | Golang客户端SDK仓库 | Python客户端SDK仓库 | Java客户端SDK仓库
深度学习
当我们训练一个神经网络模型的时候,我们经常会遇到这样的一个头疼的问题,那就是,神经网络模型的loss值不下降,以致我们无法训练,或者无法得到一个效果较好的模型。 导致训练时loss不下降的原因有很多,而且,更普遍的来说,loss不下降一般分为三种,即:训练集上loss不下降,验证集上loss不下降,和测试集上loss不下降。
继续阅读机器学习
下面是连结时序分类(CTC)的一个可视化指导图,CTC是一种用于在语音识别,手写识别和其他序列问题中训练深度神经网络的算法。 对于语音识别,我们有一个声音片段和对应校正后的转写文本数据集。不幸的是,我们不知道如何将文字记录中的字符与音频对齐,这使得训练语音识别器比最开始想的看起来更难。...
继续阅读机器学习、深度学习
ASRT是一套基于深度学习实现的语音识别系统,全称为Auto Speech Recognition Tool,由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。 本项目声学模型通过采用卷积神经网络(CNN)和连接性时序分类(CTC)方法
继续阅读深度学习
我最近做深度学习在连续中文语音识别方向的应用的时候,根据一些论文和网上一些公开代码和模型结构,设计了一个神经网络的模型。但是在训练的时候,就首先遇到了很让人头疼的欠拟合问题。 神经网络欠拟合的特征是,训练了很长时间,但是在训练集上,loss值仍然很大甚至与初始值没有太大区别,而且精确度也很低,几乎接近于0,在测试集上亦如此。
继续阅读智能语音技术
工欲善其事必先利其器,做机器学习,我们需要有利器,才能完成工作,数据就是我们最重要的利器之一。 做中文语音识别,我们需要有对应的中文语音数据集,以帮助我们完成和不断优化改进项目。我们可能很难拿到成千上万小时的语音数据集,但是这里有一些免费开源的语音数据集,大家一定不要错过。文末附数据集下载地址。我们也非常感谢相关单位和团体为国内的开源界做出的贡献。
继续阅读自然语言处理
自然语言是信息的载体,记录和传播着信息,信息论之父香农对信息的定义是“信息是用于消除随机不确定性的东西”。 信息通过编码,经过一定的信道传输,然后传递到接收者,再解码成对应的可被人理解感知的东西,就完成了一次信息的传递。
继续阅读自然语言处理
做自然语言处理有一个基本的步骤是词频统计,然而我们知道,中文的词语有单音节词、双音节词和多音节词之分,所以中文处理起来远比英文复杂得多。 不过,我们可以“偷个懒”,如果要做词频统计的文本量足够大,而且我们只需要知道词频最高的几个词的话,那么我们可以将问题简化一下。
继续阅读综合技术
曾经(2017年)安装TensorFlow的GPU版本真的不是一件容易的事(因为教程很少,本文是为数不多的可用教程),好难,网上的各种安装教程倒是不少,但是基本没有一个能完全照着那种方法就能安装成功的,甚至有些连最基本的一些必需的步骤都没写到,那样子的话能安装到位才是奇迹。 在经历各种踩坑后,我通过大量的互联网搜索,综合各个网站上写到的安装tensorflow-gpu的方法,终于总结出来一个走的通的方法,并且亲自动手实践,在Linux(Ubuntu) + Python3安装且运行成功。
继续阅读综合技术
曾有不少人问过我怎么搭建自己的博客。其实搭建一个个人的博客有很多种方式,有使用Git Page的,有使用一些博客平台的,也有自己购买网站空间或服务器搭建的,更有大神索性自己开发一套博客程序来用的。本文所介绍的方法全部基于Linux系统服务器和LEMP(即Linux、Nginx、Mysql和PHP),使用著名的WordPress程序进行安装搭建。
继续阅读ASRT
ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统训练一个中文语音识别模型。
继续阅读ASRT
ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统在测试和生产环境中部署中文语音识别API服务器。文本以CPU (Intel x86_64) + Linux + Python 3 + Nginx 为示例运行环境。
继续阅读