• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 知识库 知识库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

语音识别技术的应用包括语音识别技术

武飞扬头像
xhjyxxw
帮助0

知行礼动

大家好,今日小经来聊聊一篇关于语音识别技术的应用包括,语音识别技术的文章,现在让我们往下看看吧!

1、语音识别技术原理简介

2、语音识别技术(ASR)要解决的问题是让计算机“理解”人类的语音,并“提取”语音中包含的文本信息。ASR技术在能听会说的智能计算机系统中发挥着重要作用,相当于在计算机系统上安装了“耳朵”,使其具有“听”的功能,从而实现信息时代最自然便捷的人机交流和交互手段。

3、语音识别技术面临的问题非常艰巨和困难。虽然早在20世纪50年代,世界各国就开始孜孜不倦地研究这项技术,特别是近二十年来,国内外许多研究机构和企业都加入了语音识别技术,的研究领域,做出了巨大的努力,并取得了丰硕的成果。但直到今天,距离这项技术的完美解决还有巨大的差距,但这并不妨碍渐进式语音识别系统在很多相对受限的场合得到成功应用。

4、如今,语音识别技术已经发展成为一门涉及声学、语言学、数字信号处理和统计模式识别等多学科的综合性技术。基于语音识别技术的现代语音识别系统已经成功应用于很多场景,不同任务使用的技术会有所不同。下图是一个语音识别系统在比较一般的任务条件下的示意图。语音识别系统的构建过程包括两个部分:训练和识别。训练通常是离线进行的,对事先收集的海量语音和语言数据库进行信号处理和知识挖掘,从而获得语音识别系统所需的“声学模型”和“语言模型”;识别过程通常在线完成,自动识别用户的实时语音。识别过程通常可以分为“前端”和“后端”两个模块。“前端”模块的主要功能有端点检测(去除不必要的静音和非语音声音)、降噪、特征提取等。“后端”模块的作用是利用训练好的声学模型和语言模型,对用户语音的特征向量进行统计模式识别(也叫“解码”),从而获得所包含的文本信息。此外,后端模块中还有一个“自适应”反馈模块,可以对用户的语音进行自学习,从而做出必要的“语音模型”和“语音模型”。

5、语音识别技术的发展历史和现状

6、语音识别的研究始于20世纪50年代,当时ATT贝尔实验室实现了第一个语音识别系统———— audry系统,该系统基于共振峰提取技术,可以识别十个英文数字。

7、20世纪60年代,计算机的应用促进了语音识别的发展。这一时期的重要成果是提出了动态时间规划(DP)和线性预测分析(LPC),其中后者解决了语音信号生成模型的问题,对语音识别的发展产生了深远的影响。

8、20世纪70年代,语音识别领域取得了巨大进展。理论上,LP技术有了进一步的发展,动态时间校正技术(DTW)基本成熟,特别是矢量量化(VQ)和隐马尔可夫模型(HMM)理论已经提出。在实践中,实现了一个基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。

9、到了80年代,MFCC的参数提取技术和HMM模型的深入使用,使得语音识别技术得到了进一步的发展,在理论体系上完整准确地描述了语音识别的问题,同时在实践中逐渐发展出了更高效的求解算法。

10、自20世纪90年代以来,在Darpa test、Ears计划、近期Gales计划和我国863计划的推动下,一大批高水平的研究机构和企业加入了语音识别的研究领域,极大地推动了语音识别技术语音识别系统的发展和应用,从小词汇量、孤立词识别、特定人识别和安静环境等简单任务逐步发展到大词汇量、连续语音、非特定人和噪声环境下的识别任务,从简单的语音识别任务发展到语音翻译任务,从实验室系统发展到商用系统。

11、讯飞语音识别技术

12、语音识别技术理念是信息时代提供人机交流的最佳方式。在核心技术研究方面,科大讯飞公司一直秉承“顶天立地”的方针。“上天”就是不断创新,突破基础技术;“场地”是指技术要与实际应用相结合,最终才能产生经济效益和社会效益。讯飞语音识别技术的研究继承了这一优良传统,在基础技术上有了很大的进步和创新,特别是在特征鲁棒性、模型判别训练、大词汇量语音识别解码技术、语音模糊搜索等方面。多次在国内外著名学术期刊、会议、专刊上发表,取得丰硕成果。在技术与实际应用的结合方面,充分考虑了应用系统之间的差异,为客户提供了语音命令识别、智能语音搜索、语音检索等技术。正在开发一套完整的解决方案,用于自然连续语音流的会议内容的转录识别。

13、以下是科大讯飞对语音识别技术:的总体规划

14、命令词识别技术——在有限的命令词或语法范围内提供自动语音识别服务,需要的计算资源很少,但需要用户“配合”语音识别系统,试着说l。

15、  智能的人机交互技术—结合大词汇量语音识别、自然语言理解、信息检索等技术提供特定领域内相对开放输入的语音识别服务,对用户的限制较为宽松,在所限定的领域内可以以自然语言的方式进行人机交互。

16、  语音转写技术—在无特殊限定的范围内完成对连续自然语音进行内容转写,目前还需要较大的计算资源。

17、  语音搜索技术—语音技术和搜索技术的结合,提供最便捷的信息搜索服务。

本文到此结束,希望对大家有所帮助。

这篇好文章是转载于:知行礼动

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 知行礼动
  • 本文地址: /news/detail/tanhcjgekg