平码五不中公式规律
  • / 5
  • 下载费用:30 金币  

一种基于科大讯飞不限时间的所见即所得的语音识别方法.pdf

关 键 ?#21097;?/dt>
一种 基于 科大讯飞 不限 时间 所见即所得 语音 识别 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

CN201910084467

申请日:

20190129

公开号:

CN109637539A

公开日:

20190416

当前法律状态:

公开

有效性:

审中

法?#19978;?#24773;: 公开
IPC分类号: G10L15/22 主分类号: G10L15/22
申请人: 浪潮金融信息技术有限公司
发明人: 张家重;王建林;付宪瑞
地址: 215100 江苏省苏州市吴中开发区吴淞江工业园吴淞路818号
优先权:
专利代理机构: 11638 代理人: 王新爱
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201910084467

授权公告号:

法律状态公告日:

20190416

法律状态类型:

公开

摘要

本发明公开了一种基于科大讯飞不限时间的所见即所得的语音识别方法,首先完成异步任务实现类编写,主要包括初始化方法、后台运行方法以及数据返回接口的实现,然后,传入参数进行异步任务类的初始化,随后,启动异步任务类即可,之后,就可以实时的收到声音文件流,最后,将声音文件流传给科大讯飞语音识别平台进行语音识别,本方法由上层应用直接调取本地录音设备进?#26032;?#21046;,在录制的过程中,将录制的声音以文件流的形式进行缓存,并且每隔一段时间就将文件流返回,应用接收到文件流以后,调取科大讯飞语音识别平台的语音识别接口进行语音识别,将最终的识别结果进行展示,不再受科大讯飞api对应的10秒录制限制。

权利要求书

1.一种基于科大讯飞不限时间的所见即所得的语音识别方法,其特征在于:包括步骤一,异步声音录制及文件流的实时返回;步骤二,文件流格式和科大讯飞要求格式的适配;其中,步骤一的异步声音录制及文件流的实时返回是基于AsyncTask类,通过AudioRecord实现后台声音文件录制,实现过程主要分为以下几步:1)、编写AsyncTask的实现类,定义其初始化方法、后台运行方法以及数据返回UI接口;2)、初始化方法定义返回声音文件流间隔时间、临时文件路径,后台运行方法调取本地录音,按照数据返回UI接口进行接口实现;3)、异步任务实现类启动,并将返回的数据实时发?#36879;?#31185;大讯飞语音识别平台;4)、文件流格式适配;5)、文件流语音识别;其中步骤二的文件流格式和科大讯飞要求格式的适配为声音大小端的转换,将声音大端转化为小端,实现过程主要分为以下几步:1)、遍历文件流缓存区;2)、将文件流缓存区里面的?#32440;?#36827;行大小端转换,并写入到文件输出流里面;使用时,启动异步任务实现类,录音流程在后台运行,按照?#20184;?#30340;间隔时间,录音产生的文件流会先进行一次科大讯飞要求格式的适配,之后将文件流返回给用户,用户再调取语音识别平台进行声音文件流的识别。

?#24471;?#20070;


一种基于科大讯飞不限时间的所见即所得的语音识别方法
技术领域


本发明涉及一种语音识别的方法,特别涉及一种基于科大讯飞不限时间的所见即
所得的语音识别方法。


背景技术


使用科大讯飞提供的api进行语音识别的过程中,发现其最多可以进行10秒钟的
声音录制及识别,假如?#19981;?#26102;间超过10秒钟,该api则无法进行超出部分的录制和识别。


在语音识别越来越普及的今天,大量的应用加入了语音识别的功能,10秒钟的声
音录制和识别已经完全不能满足日渐增长的需求,更长时间的声音录制,更快速的语音识
别是目前急需要解决的问题。


发明内容


针对上述存在的技术问题,本发明的目的是:提出了一种基于科大讯飞不限时间
的所见即所得的语音识别方法,满足日常语音要求。


本发明的技术解决方案是这样实现的:一种基于科大讯飞不限时间的所见即所得
的语音识别方法,包括步骤一,异步声音录制及文件流的实时返回;步骤二,文件流格式和
科大讯飞要求格式的适配;其中,步骤一的异步声音录制及文件流的实时返回是基于
AsyncTask类,通过AudioRecord实现后台声音文件录制,实现过程主要分为以下几步:1)、
编写AsyncTask的实现类,定义其初始化方法、后台运行方法以及数据返回UI接口;2)、初始
化方法定义返回声音文件流间隔时间、临时文件路径,后台运行方法调取本地录音,按照数
据返回UI接口进行接口实现;3)、异步任务实现类启动,并将返回的数据实时发?#36879;?#31185;大讯
飞语音识别平台;4)、文件流格式适配;5)、文件流语音识别;其中步骤二的文件流格式和科
大讯飞要求格式的适配为声音大小端的转换,将声音大端转化为小端,实现过程主要分为
以下几步:1)、遍历文件流缓存区;2)、将文件流缓存区里面的?#32440;?#36827;行大小端转换,并写入
到文件输出流里面;使用时,启动异步任务实现类,录音流程在后台运行,按照?#20184;?#30340;间隔
时间,录音产生的文件流会先进行一次科大讯飞要求格式的适配,之后将文件流返回给用
户,用户再调取语音识别平台进行声音文件流的识别。


由于上述技术方案的运用,本发明与现有技术相比具有下列优点:


本发明的一种基于科大讯飞不限时间的所见即所得的语音识别方法,上层应用直
接调取本地录音设备进?#26032;?#21046;,在录制的过程中,将录制的声音以文件流的形式进行缓存,
并且每隔一段时间就将文件流返回,应用接收到文件流以后,调取科大讯飞语音识别平台
的语音识别接口进行语音识别,将最终的识别结果进行展示,因为是实时生成声音文件流,
实时进行语音的识别,并且,由于声音录制时调取的本地录音设备,不再受科大讯飞api对
应的10秒录制限制。


附图?#24471;?br>

下面结合附图对本发明技术方案作进一步?#24471;鰨?br>

附图1为传统方式调取科大讯飞的api进行语音识别的过程示意图;


附图2为本发明的一种基于科大讯飞不限时间的所见即所得的语音识别方法的示
意图。


具体实施方式


下面结合附图来?#24471;?#26412;发明。


如附图2所示为本发明所述的一种基于科大讯飞不限时间的所见即所得的语音识
别方法,包括步骤一,异步声音录制及文件流的实时返回;步骤二,文件流格式和科大讯飞
要求格式的适配;其中,步骤一的异步声音录制及文件流的实时返回是基于AsyncTask类,
通过AudioRecord实现后台声音文件录制,实现过程主要分为以下几步:1)、编写AsyncTask
的实现类,定义其初始化方法、后台运行方法以及数据返回UI接口;2)、初始化方法定义返
回声音文件流间隔时间、临时文件路径,后台运行方法调取本地录音,按照数据返回UI接口
进行接口实现;3)、异步任务实现类启动,并将返回的数据实时发?#36879;?#31185;大讯飞语音识别平
台;4)、文件流格式适配;5)、文件流语音识别;其中步骤二的文件流格式和科大讯飞要求格
式的适配为声音大小端的转换,将声音大端转化为小端,实现过程主要分为以下几步:1)、
遍历文件流缓存区;2)、将文件流缓存区里面的?#32440;?#36827;行大小端转换,并写入到文件输出流
里面;使用时,启动异步任务实现类,录音流程在后台运行,按照?#20184;?#30340;间隔时间,录音产生
的文件流会先进行一次科大讯飞要求格式的适配,之后将文件流返回给用户,用户再调取
语音识别平台进行声音文件流的识别。


本发明的一种基于科大讯飞不限时间的所见即所得的语音识别方法,上层应用直
接调取本地录音设备进?#26032;?#21046;,在录制的过程中,将录制的声音以文件流的形式进行缓存,
并且每隔一段时间就将文件流返回,应用接收到文件流以后,调取科大讯飞语音识别平台
的语音识别接口进行语音识别,将最终的识别结果进行展示,因为是实时生成声音文件流,
实时进行语音的识别,并且,由于声音录制时调取的本地录音设备,不再受科大讯飞api对
应的10秒录制限制。


上述实施例只为?#24471;?#26412;发明的技术构?#25216;?#29305;点,其目的在于让熟悉此项技术的人
士能够?#31169;?#26412;发明的内容并加以实施,并不能?#28304;?#38480;制本发明的保护?#27573;В?#20961;根据本发明
精神实质所作的等效变化或修饰,?#21152;?#28085;盖在本发明的保护?#27573;?#20869;。


关于本文
本文标题:一种基于科大讯飞不限时间的所见即所得的语音识别方法.pdf
链接地址:http://www.pqiex.tw/p-6151880.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

[email protected] 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
平码五不中公式规律 青海11选5出号走势图 2016股票融资比例 大乐透机选号码查询 北京pk10三码全天计划 股票融资是利好吗 福建11选5奇偶走势图 炒股毁一生 广东11选5专家计划 大乐透开奖直播哪个台几点 山西11选5怎样识别重号