技术能力

深度学习

80%

语音识别、语音激活检测

80%

Python

85%

Golang

75%

Java

60%

C#

50%

Linux(Ubuntu/OpenEuler)

60%

数据库(Mysql/MariaDB)

60%

Docker

50%

工作技能

服务器后端开发

85%

软件需求分析、架构设计和建模

70%

AI算法研究

70%

文档撰写

60%

项目管理

40%

视频剪辑

40%

软件(系统)测试

40%

生活技能

音乐

70%

MBTI

60%

电子游戏

50%

摄影

40%

开源项目:ASRT——一个基于深度学习的中文语音识别系统

核心算法:基于一组DCNN-CTC结构的声学模型,使用Spectrogram(语谱图)作为声学特征,并通过N-Gram语言模型解码实现。
在基本安静的标准普通话场景下,可达到85%以上的识别率,单条语音片段的识别时间开销在1秒以内。

ASRT语音识别系统还提供了基于HTTP和gRPC协议的服务端API接口,以及由Golang、Python、C#和Java语言实现的客户端SDK,支持做二次开发,将算法成果落地实用。


ASRT项目主页 | ASRT项目文档 | GitHub开源仓库 | Gitee开源仓库 | C#客户端SDK仓库 | Golang客户端SDK仓库 | Python客户端SDK仓库 | Java客户端SDK仓库

了解更多

AI柠檬博客热门文章

深度学习

如何解决神经网络训练时loss不下降的问题

当我们训练一个神经网络模型的时候,我们经常会遇到这样的一个头疼的问题,那就是,神经网络模型的loss值不下降,以致我们无法训练,或者无法得到一个效果较好的模型。 导致训练时loss不下降的原因有很多,而且,更普遍的来说,loss不下降一般分为三种,即:训练集上loss不下降,验证集上loss不下降,和测试集上loss不下降。

继续阅读

机器学习

[翻译]使用CTC进行序列建模

下面是连结时序分类(CTC)的一个可视化指导图,CTC是一种用于在语音识别,手写识别和其他序列问题中训练深度神经网络的算法。 对于语音识别,我们有一个声音片段和对应校正后的转写文本数据集。不幸的是,我们不知道如何将文字记录中的字符与音频对齐,这使得训练语音识别器比最开始想的看起来更难。...

继续阅读

机器学习、深度学习

ASRT:一个中文语音识别系统

ASRT是一套基于深度学习实现的语音识别系统,全称为Auto Speech Recognition Tool,由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。 本项目声学模型通过采用卷积神经网络(CNN)和连接性时序分类(CTC)方法

继续阅读

深度学习

深度学习:欠拟合问题的几种解决方案

我最近做深度学习在连续中文语音识别方向的应用的时候,根据一些论文和网上一些公开代码和模型结构,设计了一个神经网络的模型。但是在训练的时候,就首先遇到了很让人头疼的欠拟合问题。 神经网络欠拟合的特征是,训练了很长时间,但是在训练集上,loss值仍然很大甚至与初始值没有太大区别,而且精确度也很低,几乎接近于0,在测试集上亦如此。

继续阅读

智能语音技术

几个最新免费开源的中文语音数据集

工欲善其事必先利其器,做机器学习,我们需要有利器,才能完成工作,数据就是我们最重要的利器之一。 做中文语音识别,我们需要有对应的中文语音数据集,以帮助我们完成和不断优化改进项目。我们可能很难拿到成千上万小时的语音数据集,但是这里有一些免费开源的语音数据集,大家一定不要错过。文末附数据集下载地址。我们也非常感谢相关单位和团体为国内的开源界做出的贡献。

继续阅读

自然语言处理

统计语言模型:从中文拼音到文本

自然语言是信息的载体,记录和传播着信息,信息论之父香农对信息的定义是“信息是用于消除随机不确定性的东西”。 信息通过编码,经过一定的信道传输,然后传递到接收者,再解码成对应的可被人理解感知的东西,就完成了一次信息的传递。

继续阅读

自然语言处理

统计N元语言模型生成算法:简单中文词频统计

做自然语言处理有一个基本的步骤是词频统计,然而我们知道,中文的词语有单音节词、双音节词和多音节词之分,所以中文处理起来远比英文复杂得多。 不过,我们可以“偷个懒”,如果要做词频统计的文本量足够大,而且我们只需要知道词频最高的几个词的话,那么我们可以将问题简化一下。

继续阅读

综合技术

Linux系统下安装TensorFlow的GPU版本

曾经(2017年)安装TensorFlow的GPU版本真的不是一件容易的事(因为教程很少,本文是为数不多的可用教程),好难,网上的各种安装教程倒是不少,但是基本没有一个能完全照着那种方法就能安装成功的,甚至有些连最基本的一些必需的步骤都没写到,那样子的话能安装到位才是奇迹。 在经历各种踩坑后,我通过大量的互联网搜索,综合各个网站上写到的安装tensorflow-gpu的方法,终于总结出来一个走的通的方法,并且亲自动手实践,在Linux(Ubuntu) + Python3安装且运行成功。

继续阅读

综合技术

手把手教你从零开始搭建个人博客

曾有不少人问过我怎么搭建自己的博客。其实搭建一个个人的博客有很多种方式,有使用Git Page的,有使用一些博客平台的,也有自己购买网站空间或服务器搭建的,更有大神索性自己开发一套博客程序来用的。本文所介绍的方法全部基于Linux系统服务器和LEMP(即Linux、Nginx、Mysql和PHP),使用著名的WordPress程序进行安装搭建。

继续阅读

ASRT

教你如何使用ASRT训练中文语音识别模型

ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统训练一个中文语音识别模型。

继续阅读

ASRT

教你如何使用ASRT部署中文语音识别API服务器

ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统在测试和生产环境中部署中文语音识别API服务器。文本以CPU (Intel x86_64) + Linux + Python 3 + Nginx 为示例运行环境。

继续阅读