前一段时间为了实现声波传输,网上找了半天,好不容易找到一个实现,但准确性远不能满足要求,没办法,只好自己写了一个。
后来一哥们要求在mipsel平台和arm平台上使用,就帮他用c移植到了mipsel平台,实现了在不到普通电脑千分之一cpu的系统平台上的运行。搞定这个后cpu消耗非常低,基本上应该算是没有运行不了的平台了。
一、准确性
准确性95%以上,如果有识别有问题的情况,你可以开启调试模式,该模式下会自动保存识别失败的的音频段,你可以发给我分析识别失败的原因,如果真是识别器没有考虑到的情况的话,调整识别规则就可以完善识别到了。而且传输中加入了校验码,校验码有两个目的,一个是保证识别正确性。保证识别结果不然就识别失败,而如果识别到了就一定是对的,也就是说不会出现传输的是1,而识别提示为0;另一个是错误自动修正,从而保证传输中可以有20%左右(取决于你传输的数据长度)的错误而可以自动修正,从而使得使用过程中基本上识别是不会出错的。识别接口中参数指定了识别是否成功完成,错误码指出了如果识别失败的话,失败的原因。
二、接口简单
我的接口尽量做得简单,这样用起来也比较小白,既然是当成一个库,使用起来越简单越好,就尽量不要去管底层的一些控制参数,比如说声音采样频率、采样精度、采样格式、传输频率、传输码表、音量、缓冲区大小,这些在参数中你就不用管了,当然你想定制的话其实这些参数也全部是都是可以定制的。在这里,这些参数的默认值我也说一下:声音方面默认参数为:声音采样频率为44100,单声道,2个字节(16位)长的采样精度,小端编码,桢大小就为1*2=2个字节,那么每秒处理的数据量就是44100*2=88200字节。传输频率为高频段,抗干扰能力非常好,不管你是在闹市、马路、KTV、或者其它室外场景下,或者你在家里开着大音箱听歌都不会影响到数据的传输。码表为16进制的数据编码,也就是所有数据都会编成16进制后传输。缓冲区的话默认需10k左右的缓冲区(里面其它的内存分配都在内存池中完成,长时间运行解码不会再分配内存)。如果这些参数你完全不懂,就忽略就算了,因为接口足够简单,能用就可以了,也不用理解那么多原理。不过解码器要求你传入的音频数据是这些格式,特别是输入数据要求为44100,单声道,16bits采样精度,小端编码的音频数据。
三、混音音效
另外实际上因为传输频率属于高频段,开始超出正常人可听到的阶段,所以发送的时候感觉没什么反应一样,所以可以在人耳可听到的范围另外加一段可听到的音频音效(咻咻咻、啾啾啾随便你,呵呵)让用户知道系统正在通讯中,最后的效果就是人听到的是人耳可听到那部分你加的音频音效,可实际上设备则可解码出真正的信号,而不会相互干扰。
四、传输距离
传输距离的话是取决于音量的,音量比较大的,传输距离就大,一般以手机的最大音量5-10米没问题,音量设小的话可以控制在10cm-30cm左右。
五、性能
至于性能,系统有两种工作模式:一种是优化内存模式,耗CPU稍多一点,但耗内存小,在当前正常使用的电脑或者现在的智能手机下使用是没有问题的,正常pc机的cpu基于可以看到在1%以下,反正windows任务管理器里显示的是0,应该是1%以下就会显示为0%,估计在百分之零点几左右吧。另一种是优化CPU模式,如果你是在计算能力非常有限的平台上使用,比如说计算能力不到pc千分之一的平台上使用,你可以使用这种模式,这种模式下,基本不会占用你的CPU,但会占内存会大一些,但如果你的CPU真的非常慢,你解码时间会长一点,但无论你的系统有多慢,都不会解不出来,也不会影响解码正确性,只是速度慢的话解码出来的时间就稍长一些。
六、数据传输量
说一说传输数据量的问题,首先我要说一下,我最先了解声波通讯的时候还以为传输率可以达到几k/秒,实际上声波1秒也就传输个十几个字符左右,而且一般来说传输总字符如果达到40个以上,解码正确率就会下降,数据量越大,出错率就会升高。所以想以k级来传输数据量的人就不要想了。当然这也是对怎么使用声波通讯的机制不了解的原因:声波传输使用时主要是作为握手和对接使用,真正的数据是通过对接后在互联网上传输。比如说面对面的声波支付,A要付款给B,那么声波通讯在这里面主要是传输用户标志,或者付款单编号来快速握手(这当然跟你设计的支付流程有关)。我这里以一种模拟刷卡的流程举例说明:A(客户)要付款给B(商家),我们设想如果是刷卡的话,流程可能是这样的,A(客户)在B(商家)的POS机上刷一下银行卡,B(商家)就知道A(客户)是哪张银行卡,从而把该卡和金额传到支付公司去扣款。那么换成声波后也是一样的,A(客户)在手机上点一下付款,A(客户)的手机发出一串声波,声波上传输A(客户)的用户标识,传到B(商家)的手机,这时B(商家)就可以把A(客户)的标志和扣款金额传到支付公司去扣款了。当然你也可以设计一个反过来的流程,就是由B端(商家端)发出一串账单音频,而由A端接收(客户关),但原理是一样的。所以在这整个流程里面,声波是做系统对接使用的,替代刷银行卡、或者扫二维码的对接方式,然后真正的数据传输还是在互联网上传输。
七、编码
我这里采用的是16进制的传输码,你自己要传输的信息可以自己先编成16进制码,不过码表其实是可以定制的,比如说你想传输数据量更大一点,那也可以扩展到32进制,这样相对来说传输数据量编码后会更小,数据量可以传输得更大一些。如果你要传输的是数字,先把数字编成16进制编码,如果你要传字母,那么一个字母可以编成2个16进制的字符。
我这里列出几种编码的情况,比如说你要传输QQ号,手机号这类数字,那就最好转成16进制后再传输。以传输手机号为例:因为手机号肯定是以1开始的,那么1就可以不传了,而且都是以13,15,18开头,那么你可以把3,5,8先映射为1,2,3,然后再做16进制转码。当然解码端你自己怎么做的编码就怎么做解码,这样一个手机号本来有11位,优化下来就可以做到9位,或者8位。呵呵,声波传输就是要做到尽量小的数据量,数据量越小传输准确率就越可靠,你的系统就越可靠。
我这里列出几种编码的示例。
手机号编成16进制声波通讯编码:
- /************************************************************************
- 声波通讯库示例,16进制声波通讯编码
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- //13,14,15,18开头的手机号,手机号去除1以后,16进制在9位以内
- public static String encode(String _mobile)
- {
- if(_mobile.length() == 11 && _mobile.startsWith("1"))
- {
- long _number = Long.parseLong(_mobile.substring(1));
- String s = Long.toHexString(_number);
- while(s.length() < 9)
- {
- s = "0" + s;
- }
- return s;
- }
- return null;
- }
任意字符串(先换成byte[])编成16进制声波通讯编码:
- /************************************************************************
- 声波通讯库示例,16进制声波通讯编码
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- public static final char[] hexChars = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f'};
- public static String encodeString(byte[] _val)
- {
- StringBuffer result = new StringBuffer(_val.length*2);
- for(int i = 0; i < _val.length; i ++)
- {
- result.append(hexChars[(_val[i] >> 4) & 0x0f]);
- result.append(hexChars[_val[i] & 0x0f]);
- }
- return result.toString();
- }
八、使用场景
声波实际上可以看成是一种比二维码可友好的传输方式,二维码能实现的功能与声波有很大的相似性,但声波使用时会更友好。做以上这些功能的时候,基本上都是只要靠近在手机上点一下/划一下/推一下/甩一下/摇一下(这是你自己定的)就可以了,而不需要像二维码一样还要打开摄像头、对准去拍那样比较麻烦。相比来说,声波传输更像刷卡一样方便简单,可以理解为类似NFC的一种近场通讯技术。
比如说你可以用声波支付,声波会员卡,声波券票,声音名片,声波签到,声波排队,做wifi和密码共享或者设定,做文件/图片、你App里面的任何项目分享,用声波关注微博、微信等等。
声波支付的流程前面有讲过,实际上有可能稍微复杂一点,但大概是这样的思路。
声波会员卡是指用户到店铺后不需要带物理卡了,而是手机代替了所有的会员卡,在商家一碰,会员信息就自动显示出来了。
声波券票也很简单,比如说一张电子团购券,电子电影券,可以设置成一个唯一的编码,到场后与录音设备一碰,系统就能识别到这张券票
声波签到是指在固定位置安装签到软件,用户到达后,可以快速完成签到操作。
声波分享以文件/图片、或者你App里面的任何项目为例:比如A要把一张图片发送给B,那么A点击一下共享按钮(或者一推一丢都行),这时手机通过声音把这个图片的编号发送出去,当B收到这个标志时,马上从你平台的服务器上下载这张图片。最后的效果就是A在要分享的图片上一点,B就能收到该张图片,非常的方便快捷。
九、运行平台
这个声波传输库可以运行在windows平台(所有windows系统), linux平台, mipsel平台, arm平台, iphone平台, android平台,全部都有SDK,后面的附件中有各个平台的库,你自己可以选择下载
十、代码及示例
库的结构非常简单:一个发送端,一个接收端。发送端很简单,基本上就是一个send函数。接收端稍微复杂一点,但也是很简单的:创建一个解码器,设置监听,往解码器送音频数据(解码器就会开始分析音频数据,并在监听到信号后通知你),最后停止解码器和销毁解码器。使用还是很简单的,下面和附件中有例子说明。
这种库的使用毕竟是商用,所以就不能免费了,呵呵。不过如果你完全是没有任何商业目的的公益项目,我也是完全可以免费给你用的。
试用库识别次数有限,或者没有进行降噪处理
各个平台的例子及源码
android平台声波通讯发送端接口:
- /************************************************************************
- 声波通讯库示例,android平台声波通讯发送端
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- //创建声波通讯播放器
- player = new VoicePlayer();
- //开始播放
- player.play("12345678abcdef", 1, 200);
iphone平台声波通讯发送端接口:
- /************************************************************************
- 声波通讯库示例,iphone平台声波通讯发送端
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- NSAutoreleasePool *tempPool = [[NSAutoreleasePool alloc] init];
- //创建声波通讯播放器
- VoicePlayer *player=[[VoicePlayer alloc] init];
- //播放
- [player play:@"12345678" playCount:1 muteInterval:0];
- //没播放完之前,不要释放内存
- while (![player isStopped]) {
- usleep(3300 * 1000);//300ms
- }
- [tempPool drain];
Android平台声波通讯解码端代码:
- /************************************************************************
- 声波通讯库示例,Android平台声波通讯解码端
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- VoiceRecognition mRecognition = new VoiceRecognition();
- mRecognition.setListener(new VoiceRecognitionListener()
- {
- @Override
- public void onRecognitionStart() {
- }
- public void onRecognitionEnd(int _recogStatus, String _val)
- {
- if(_recogStatus == VoiceRecognition.Status_Success)
- {
- System.out.println(_val);
- }
- }
- });
- mRecognition.start();
c通用声波通讯解码端接口
- /************************************************************************
- 声波通讯库示例,声波通讯库c解码接口
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- #ifdef VOICE_RECOG_DLL
- #define VOICERECOGNIZEDLL_API __declspec(dllexport)
- #else
- #ifdef WIN32
- #define VOICERECOGNIZEDLL_API __declspec(dllimport)
- #else
- #define VOICERECOGNIZEDLL_API
- #endif
- #endif
- #ifndef VOICE_RECOG_H
- #define VOICE_RECOG_H
- #ifdef __cplusplus
- extern "C" {
- #endif
- enum VRErrorCode
- {
- VR_SUCCESS = 0
- };
- enum DecoderPriority
- {
- CPUUsePriority = 1//不占内存,但CPU消耗比较大一些
- , MemoryUsePriority = 2//不占CPU,但内存消耗大一些
- };
- typedef enum {vr_false = 0, vr_true = 1} vr_bool;
- typedef void (*vr_pRecognizerStartListener)(void);
- //_result如果为VR_SUCCESS,则表示识别成功,否则为错误码,成功的话_data才有数据
- typedef void (*vr_pRecognizerEndListener)(int _result, char *_data, int _dataLen);
- //创建声波识别器
- VOICERECOGNIZEDLL_API void *vr_createVoiceRecognizer(DecoderPriority _decoderPriority = CPUUsePriority);
- //销毁识别器
- VOICERECOGNIZEDLL_API void vr_destroyVoiceRecognizer(void *_recognizer);
- //设置识别到信号的监听器
- VOICERECOGNIZEDLL_API void vr_setRecognizerListener(void *_recognizer, vr_pRecognizerStartListener _startListener, vr_pRecognizerEndListener _endListener);
- //开始识别
- //这里一般是线程,这个函数在停止识别之前不会返回
- VOICERECOGNIZEDLL_API void vr_runRecognizer(void *_recognizer);
- //停止识别,该函数调用后vr_runRecognizer会返回
- //该函数只是向识别线程发出退出信号,判断识别器是否真正已经退出要使用以下的vr_isRecognizerStopped函数
- VOICERECOGNIZEDLL_API void vr_stopRecognize(void *_recognizer);
- //判断识别器线程是否已经退出
- VOICERECOGNIZEDLL_API vr_bool vr_isRecognizerStopped(void *_recognizer);
- //要求输入数据要求为44100,单声道,16bits采样精度,小端编码的音频数据
- //小端编码不用特别处理,一般你录到的数据都是小端编码的
- VOICERECOGNIZEDLL_API int vr_writeData(void *_recognizer, char *_data, int _dataLen);
- #ifdef __cplusplus
- }
- #endif
- #endif
使用c声波通讯接口从wav文件中解码的例子:
- /************************************************************************
- 声波通讯库示例,从wav文件中读取音频信号进行解码,该工程示例是可跨平台的
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- //当次解码结束的回调函数
- void waveRecognizerEnd(int _recogStatus, char *_data, int _dataLen)
- {
- if (_recogStatus == VR_SUCCESS)
- {
- char buf[51];
- memcpy(buf, _data, _dataLen);
- buf[_dataLen] = 0;
- printf("------------------recognized data:%s\n", buf);
- }
- else
- {
- printf("------------------recognize invalid data, errorCode:%d\n", _recogStatus);
- }
- }
- //识别到有信号时开始解码回调函数
- void waveRecognizerStart()
- {
- printf("------------------recognize start\n");
- }
- //WIN32与linux所需的线程函数原型有点不一样
- #ifdef WIN32
- DWORD WINAPI waveRunVoiceRecognize( LPVOID _recognizer)
- {
- #else
- void *waveRunVoiceRecognize( void * _recognizer)
- {
- printf("voice recognizer thread start:%d\n", getpid());
- #endif
- vr_runRecognizer(_recognizer);
- return 0;
- }
- //从wav文件中装载数据进入声波识别器
- void test_voiceRecog_from_wav(int argc, char* argv[])
- {
- char *wavFile = (char *)"data.wav";
- if(argc > 1)
- {
- wavFile = argv[1];
- }
- //读入wav文件
- struct WavData wavData;
- memset(&wavData, 0, sizeof(wavData));
- readWave(wavFile, &wavData);
- printf("%s data size:%d\n", wavFile, (int)wavData.size);
- //创建识别器,并开始运行
- void *recognizer = vr_createVoiceRecognizer(MemoryUsePriority);
- vr_setRecognizerListener(recognizer, waveRecognizerStart, waveRecognizerEnd);
- #ifdef WIN32
- HANDLE recogThread = CreateThread( NULL, 0, waveRunVoiceRecognize, recognizer, 0, 0 );
- //_beginthread(waveRunVoiceRecognize, 0, recognizer);
- #else
- pthread_t recogThread;
- pthread_create(&recogThread, NULL, waveRunVoiceRecognize, recognizer);
- //printf("voice recognizer thread id:%lu\n", (recogThread));
- #endif
- //往识别器写入数据,这里可以反复写
- vr_writeData(recognizer, wavData.data, wavData.size);
- //通知识别器停止,并等待识别器真正退出
- do
- {
- vr_stopRecognize(recognizer);
- printf("recognizer is quiting\n");
- #ifdef WIN32
- Sleep(1000);
- #else
- sleep(1);
- #endif
- } while (!vr_isRecognizerStopped(recognizer));
- //销毁识别器
- vr_destroyVoiceRecognizer(recognizer);
- printf("press enter key to exit.......\n");
- char c;
- scanf("%c", &c);
- }
使用c声波通讯接口从实时录音数据中解码的例子:
- /************************************************************************
- 声波通讯库示例,从实时录音数据获取音频信号进行解码,该工程示例是可跨平台的
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- //识别到有信号时开始解码回调函数
- void recorderRecognizerStart()
- {
- printf("------------------recognize start\n");
- }
- //当次解码结束的回调函数
- void recorderRecognizerEnd(int _recogStatus, char *_data, int _dataLen)
- {
- if (_recogStatus == VR_SUCCESS)
- {
- char buf[51];
- memcpy(buf, _data, _dataLen);
- buf[_dataLen] = 0;
- printf("------------------recognized data:%s\n", buf);
- }
- else
- {
- printf("------------------recognize invalid data, errorCode:%d\n", _recogStatus);
- }
- }
- #ifdef WIN32
- void runRecorderVoiceRecognize( void * _recognizer)
- #else
- void *runRecorderVoiceRecognize( void * _recognizer)
- #endif
- {
- vr_runRecognizer(_recognizer);
- }
- int recorderShortWrite(void *_writer, const void *_data, unsigned long _sampleCout)
- {
- char *data = (char *)_data;
- void *recognizer = _writer;
- return vr_writeData(recognizer, data, (int)_sampleCout);
- }
- void test_recorderVoiceRecog()
- {
- //创建识别器,并设置监听器
- void *recognizer = vr_createVoiceRecognizer();
- vr_setRecognizerListener(recognizer, recorderRecognizerStart, recorderRecognizerEnd);
- //创建录音机
- void *recorder = NULL;
- int r = initRecorder(44100, 1, 16, 512, &recorder);//要求录取short数据
- if(r != 0)
- {
- printf("recorder init error:%d", r);
- return;
- }
- //开始录音
- //r = startRecord(recorder, recognizer, recorderFloatWrite);//float数据
- r = startRecord(recorder, recognizer, recorderShortWrite);//short数据
- if(r != 0)
- {
- printf("recorder record error:%d", r);
- return;
- }
- //开始识别
- #ifdef WIN32
- //CreateThread( NULL, 0, runRecorderVoiceRecognize, recognizer, 0, 0 );
- _beginthread(runRecorderVoiceRecognize, 0, recognizer);
- #else
- pthread_t ntid;
- pthread_create(&ntid, NULL, runRecorderVoiceRecognize, recognizer);
- #endif
- printf("\n\n\nrecognize start, waiting for signals ............\n");
- char c = 0;
- do
- {
- printf("press q to end recognize\n");
- scanf_s("%c", &c);
- } while (c != 'q');
- //停止录音
- r = stopRecord(recorder);
- if(r != 0)
- {
- printf("recorder stop record error:%d", r);
- }
- r = releaseRecorder(recorder);
- if(r != 0)
- {
- printf("recorder release error:%d", r);
- }
- //通知识别器停止,并等待识别器真正退出
- do
- {
- vr_stopRecognize(recognizer);
- printf("recognizer is quiting\n");
- #ifdef WIN32
- Sleep(1000);
- #else
- sleep(1);
- #endif
- } while (!vr_isRecognizerStopped(recognizer));
- //销毁识别器
- vr_destroyVoiceRecognizer(recognizer);
- }
相应的录音机抽象接口:
- /************************************************************************
- 声波通讯库示例,录音机抽象接口,该工程示例是可跨平台的
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- //_data的数据格式是根据initRecorder传入的数据类型定的,一般可能为short。
- //_sampleCout是表示_data中含有的样本数,不是指_data的长度
- //返回已经处理的信号数,如果返回-1,则录音线程应退出
- typedef int (*r_pwrite)(void *_writer, const void *_data, unsigned long _sampleCout);
- /************************************************************************/
- /* 创建录音机
- /* _sampleRateInHz为44100
- /* _channel为单声道,1为单声道,2为立体声
- /* _audioFormat为一个信号的bit数,单声道双字节精度的话为16
- /************************************************************************/
- int initRecorder(int _sampleRateInHz, int _channel, int _audioFormat, int _bufferSize, void **_precorder);
- /************************************************************************/
- /* 开始录音
- /************************************************************************/
- int startRecord(void *_recorder, void *_writer, r_pwrite _pwrite);
- /************************************************************************/
- /* 停止录音
- /************************************************************************/
- int stopRecord(void *_recorder);
- /************************************************************************/
- /* 释放录音器的资源
- /************************************************************************/
- int releaseRecorder(void *_recorder);
使用PA实现的录音机接口,可跨平台:
- /************************************************************************
- 声波通讯库示例,PA库实现的录音机接口,该库是跨平台的
- 声波通讯库特征:
- 准确性95%以上,其实一般是不会出错的。
- 接口非常简单,有完整的示例,3分钟就可以让你的应用增加声波通讯功能
- 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的
- 基本的编码为16进制,而通过编码可传输任何字符
- 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行
- 可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例
- 详情可查看:http://blog.csdn.net/softlgh
- 作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
- ************************************************************************/
- #include "record.h"
- #include <stdio.h>
- #include <stdlib.h>
- //#include <syslib.h>
- #include "portaudio.h"
- #pragma comment(lib, "portaudio_x86.lib")
- #define SAMPLE_RATE (44100)
- #define FRAMES_PER_BUFFER (512)
- #define NUM_SECONDS (5)
- #define NUM_CHANNELS (2)
- #define DITHER_FLAG (0) /**/
- #define WRITE_TO_FILE (0)
- /* Select sample format. */
- #if 1
- #define PA_SAMPLE_TYPE paFloat32
- typedef float SAMPLE;
- #define SAMPLE_SILENCE (0.0f)
- #define PRINTF_S_FORMAT "%.8f"
- #elif 1
- #define PA_SAMPLE_TYPE paInt16
- typedef short SAMPLE;
- #define SAMPLE_SILENCE (0)
- #define PRINTF_S_FORMAT "%d"
- #elif 0
- #define PA_SAMPLE_TYPE paInt8
- typedef char SAMPLE;
- #define SAMPLE_SILENCE (0)
- #define PRINTF_S_FORMAT "%d"
- #else
- #define PA_SAMPLE_TYPE paUInt8
- typedef unsigned char SAMPLE;
- #define SAMPLE_SILENCE (128)
- #define PRINTF_S_FORMAT "%d"
- #endif
- struct PARecorder
- {
- PaStream* stream;
- PaStreamParameters inputParameters,
- outputParameters;
- int sampleRateInHz, channel, audioFormat, bufferSize;
- void *writer;
- r_pwrite write;
- };
- /* This routine will be called by the PortAudio engine when audio is needed.
- ** It may be called at interrupt level on some machines so don't do anything
- ** that could mess up the system like calling malloc() or free().
- */
- static int recordCallback( const void *inputBuffer, void *outputBuffer,
- unsigned long framesPerBuffer,
- const PaStreamCallbackTimeInfo* timeInfo,
- PaStreamCallbackFlags statusFlags,
- void *userData )
- {
- //void *recognizer = userData;
- PARecorder *recorder = (PARecorder *)userData;
- int r = recorder->write(recorder->writer, inputBuffer, framesPerBuffer);
- if (r >= 0)
- {
- return paContinue;
- }
- else
- {
- return paComplete;
- }
- }
- int initRecorder(int _sampleRateInHz, int _channel, int _audioFormat, int _bufferSize, void **_precorder)
- {
- PaError err = Pa_Initialize();
- if( err != paNoError )
- {
- Pa_Terminate();
- }
- PARecorder *recorder = new PARecorder();
- recorder->stream = NULL;
- recorder->sampleRateInHz = _sampleRateInHz;
- recorder->channel = _channel;
- recorder->audioFormat = _audioFormat;
- recorder->bufferSize = _bufferSize;
- recorder->writer = NULL;
- *_precorder = recorder;
- return err;
- }
- int startRecord(void *_recorder, void *_writer, r_pwrite _pwrite)
- {
- PARecorder* recorder = (PARecorder*)_recorder;
- recorder->write = _pwrite;
- recorder->writer = _writer;
- PaStreamParameters *inputParameters = &recorder->inputParameters;
- inputParameters->device = Pa_GetDefaultInputDevice(); /* default input device */
- if (inputParameters->device == paNoDevice) {
- fprintf(stderr,"Error: No default input device.\n");
- Pa_Terminate();
- return -1;//这个编号要与PA的其它编号不重复
- }
- inputParameters->channelCount = recorder->channel;
- if(recorder->audioFormat == 0)inputParameters->sampleFormat = paFloat32;
- else inputParameters->sampleFormat = paInt16;
- //inputParameters->sampleFormat = PA_SAMPLE_TYPE;
- inputParameters->suggestedLatency = Pa_GetDeviceInfo( inputParameters->device )->defaultLowInputLatency;
- inputParameters->hostApiSpecificStreamInfo = NULL;
- /* Record some audio. -------------------------------------------- */
- PaError err = Pa_OpenStream(
- &recorder->stream,
- &recorder->inputParameters,
- NULL, /* &outputParameters, */
- recorder->sampleRateInHz,
- recorder->bufferSize,
- paClipOff, /* we won't output out of range samples so don't bother clipping them */
- recordCallback,
- recorder );
- if (err == paNoError)
- {
- err = Pa_StartStream( recorder->stream );
- }
- if( err != paNoError )
- {
- delete recorder;
- }
- return err;
- }
- int stopRecord(void *_recorder)
- {
- PaError err = paNoError;
- if(_recorder != NULL)
- {
- PARecorder *recorder = (PARecorder *)_recorder;
- PaError err = Pa_CloseStream( recorder->stream );
- }
- return err;
- }
- int releaseRecorder(void *_recorder)
- {
- PaError err = paNoError;
- err = Pa_Terminate();
- if(_recorder != NULL)
- {
- PARecorder *recorder = (PARecorder *)_recorder;
- delete recorder;
- }
- return err;
- }
所有代码都在附件中
附件说明:
各平台相应的文件在相应平台的文件夹下,有些平台文件夹下只有编码端或者解码端,或者是因为不需要,或者是我自己现在没用到,也懒得去编译了,你自己需要的时候找我吧。各平台的库是demo版,c语言版是限制了解码次数,android的java版是没有去除噪音功能,你自己如果真正需要相应的正式版,再找我吧。各个平台的编码端都没有任何限制
本文件夹下包含:
VoiceRecogFromRecorder.exe:从windows录音设备读取音频数据解码信号的示例程序,其代码在windows文件夹下。该示例工程是可跨平台编译的,链接时去链接相应平台的.so文件就可以了。使用时确保windows录音正常,然后从android手机播放信号后windows上就能识别到了。
VoiceRecogFromWav.exe:从本目录下的data.wav文件读取音频数据解码信号的示例,代码在windows文件夹下。该示例工程是可跨平台编译的,链接时去链接相应平台的.so文件就可以了。
声波通讯测试.apk:android平台上同时进行音频编码和解码的示例,其代码在android文件夹下
voiceDemoWithNoise.jar:android平台上同时进行音频编码和解码库,此库为没有处理噪音的开发版,不是正式版
各平台文件夹:
android:示例apk,java版的编码和解码库,相应的解码、解码使用示例代码,但解码库没有降噪处理,错误率比正式版高。
iphone:现在我只用到了编码端和使用示例代码,解码端没有编译。
windows:现在我只用到了解码端,所以只有解码库,限制了使用次数。windows平台文件夹下有使用声波通讯库的完整示例代码,这些示例代码实际上是跨平台,可在任何支持c的平台上编译运行,包括linux,arm,mipsel等平台,arm平台,linux平台,mipsel平台上使用解码库与windows相同,链接时去链接相应平台的.so文件就可以了。示例中包括从wav文件读取音频数据,或者从录音机读取音频数据。
arm:现在我只用到了解码端,所以只有解码库,限制了使用次数。解码使用示例代码见windows文件夹下
linux:现在我只用到了解码端,所以只有解码库,限制了使用次数。解码使用示例代码见windows文件夹下
mipsel:现在我只用到了解码端,所以只有解码库,限制了使用次数。解码使用示例代码见windows文件夹下
作者: 夜行侠 QQ:3116009971 邮件:3116009971@qq.com
相关推荐
跨平台声波通讯库(新版) 声波通讯库特征: 准确性95%以上,其实一般是...可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例 http://blog.csdn.net/softlgh/article/details/40507623
跨平台声波通讯库 声波通讯库特征: 准确性95%以上,其实一般是不会出错...可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel都有示例 http://blog.csdn.net/softlgh/article/details/40507623
iphone, windows, linux, arm, mipsel, stm32都有示例。 详情了解:http://blog.csdn.net/softlgh/article/details/40507623 也可从http://pan.baidu.com/s/1mi00vhe下载 后面还会上传最近两年做过的一些声音信号...
声波广告互动的信号传输距离在10-20米以上,通过设备传输距离可在50米以上 性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行 可支持任何平台,常见的平台android , ...
可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel, stm32都有示例。 详情了解:http://blog.csdn.net/softlgh/article/details/40507623 也可从http://pan.baidu.com/s/1mi00vhe下载 后面还...
性能非常强,没有运行不了的平台,而且通过内存池优化,长时间解码不再分配新内存,可7*24小时运行 可支持任何平台,常见的平台android , iphone, windows, linux, arm, mipsel, stm32都有示例。 详情了解:...
可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel, stm32都有示例。 详情了解:http://blog.csdn.net/softlgh/article/details/40507623 没有积分的也可从...
接口非常简单,3分钟就可以让你的应用增加声波通讯功能 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的 可自己任意调整通信频段,支持低频有声频段,也支持高频无声频段,无声频段可混音任意效果声音,如咻...
接口非常简单,3分钟就可以让你的应用增加声波通讯功能 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的 可自己任意调整通信频段,支持低频有声频段,也支持高频无声频段,无声频段可混音任意效果声音,如咻...
接口非常简单,3分钟就可以让你的应用增加声波通讯功能 抗干扰性强,基本上无论外界怎么干扰,信号都是准确的 可自己任意调整通信频段,支持低频有声频段,也支持高频无声频段,无声频段可混音任意效果声音,如咻...
可支持任何平台,常见的平台android, iphone, windows, linux, arm, mipsel, stm32都有示例。 详情了解:http://blog.csdn.net/softlgh/article/details/40507623 后面还会上传最近两年做过的一些声音信号处理项目:...