宣傳一下本身的qq羣:5946699 (暗號:C#交流) 歡迎喜歡C#,熱愛C#,正在學習C#,準備學習C#的朋友來這裏互相學習交流,共同進步javascript
羣剛建,人很少,可是都是真正熱愛C#的 我也是熱愛C#的 但願你們能夠一塊兒交流,共同進步html
最近公司須要用到web錄音的功能html5
本人接手了這個任務java
在網上找了一些資料node
http://www.jsjtt.com/webkaifa/html5/2013-08-28/34.htmlweb
http://javascript.ruanyifeng.com/bom/webrtc.html編程
講的都差很少瀏覽器
也就是怎麼使用 getUserMedia緩存
下載來的栗子也比較簡單,能夠直接運行服務器
栗子中最後返回的是Blob數據
return new Blob([dataview], { type: type })
由於對html5不熟,因此又查了一些數據
原來HTML5中使用FormData這個對象好方便
var fd = new FormData(); fd.append("audioData", blob); var xhr = new XMLHttpRequest(); xhr.open("POST", url); xhr.send(fd);
在C#服務器端 以下代碼就能夠接收了
public void ProcessRequest(HttpContext context) { if (context.Request.Files.Count > 0) { context.Request.Files[0].SaveAs("d:\\1.wav"); } }
是的,使用上面的栗子,直接錄音保存後基本上2秒就須要400K,一段20秒的錄音就達到了的4M
這樣的數據根本沒法使用,必須想辦法壓縮數據
我開始嘗試讀每一段代碼
function encodeWAV(samples){ var buffer = new ArrayBuffer(44 + samples.length * 2); var view = new DataView(buffer); /* RIFF identifier */ writeString(view, 0, 'RIFF'); /* file length */ view.setUint32(4, 32 + samples.length * 2, true); /* RIFF type */ writeString(view, 8, 'WAVE'); /* format chunk identifier */ writeString(view, 12, 'fmt '); /* format chunk length */ view.setUint32(16, 16, true); /* sample format (raw) */ view.setUint16(20, 1, true); /* channel count */ view.setUint16(22, 2, true); /* sample rate */ view.setUint32(24, sampleRate, true); /* byte rate (sample rate * block align) */ view.setUint32(28, sampleRate * 4, true); /* block align (channel count * bytes per sample) */ view.setUint16(32, 4, true); /* bits per sample */ view.setUint16(34, 16, true); /* data chunk identifier */ writeString(view, 36, 'data'); /* data chunk length */ view.setUint32(40, samples.length * 2, true); floatTo16BitPCM(view, 44, samples); return view; }
上面的代碼,就是把字節數據格式化成wav的格式的過程
因此我又去查了wav的頭文件
要壓縮,就要從上面三個紅圈的地方入手
最簡單的就是把雙聲道改爲單聲道的,
在錄音的時候只須要記錄一個聲道就能夠了
// 建立聲音的緩存節點,createJavaScriptNode方法的 // 第二個和第三個參數指的是輸入和輸出都是雙聲道。 //recorder = context.createJavaScriptNode(bufferSize, 2, 2); recorder = context.createJavaScriptNode(bufferSize, 1, 1);//這裏改爲1 this.node.onaudioprocess = function(e){ if (!recording) return; worker.postMessage({ command: 'record', buffer: [ e.inputBuffer.getChannelData(0)//, //e.inputBuffer.getChannelData(1)// 這裏只須要保存一個 ] }); } function exportWAV(type){ var bufferL = mergeBuffers(recBuffersL, recLength); //var bufferR = mergeBuffers(recBuffersR, recLength); var interleaved = interleave(bufferL);//, bufferR); //合併數據的時候去到對右聲道的處理 var dataview = encodeWAV(interleaved); var audioBlob = new Blob([dataview], { type: type }); this.postMessage(audioBlob); } function interleave(inputL){//, inputR){//混合聲道的時候去掉對右聲道的處理 var length = inputL.length ;//+ inputR.length; var result = new Float32Array(length); var index = 0, inputIndex = 0; while (index < length){ result[index++] = inputL[inputIndex]; //result[index++] = inputR[inputIndex]; inputIndex++; } return result; }
而後修改一下注釋,我不喜歡英文的....
function encodeWAV(samples) { var dataLength = samples.length * 2; var buffer = new ArrayBuffer(44 + dataLength); var view = new DataView(buffer); var sampleRateTmp = sampleRate; var sampleBits = 16; var channelCount = 1; var offset = 0; /* 資源交換文件標識符 */ writeString(view, offset, 'RIFF'); offset += 4; /* 下個地址開始到文件尾總字節數,即文件大小-8 */ view.setUint32(offset, /*32這裏地方栗子中的值錯了,可是不知道爲何依然能夠運行成功*/ 36 + dataLength, true); offset += 4; /* WAV文件標誌 */ writeString(view, offset, 'WAVE'); offset += 4; /* 波形格式標誌 */ writeString(view, offset, 'fmt '); offset += 4; /* 過濾字節,通常爲 0x10 = 16 */ view.setUint32(offset, 16, true); offset += 4; /* 格式類別 (PCM形式採樣數據) */ view.setUint16(offset, 1, true); offset += 2; /* 通道數 */ view.setUint16(offset, channelCount, true); offset += 2; /* 採樣率,每秒樣本數,表示每一個通道的播放速度 */ view.setUint32(offset, sampleRateTmp, true); offset += 4; /* 波形數據傳輸率 (每秒平均字節數) 通道數×每秒數據位數×每樣本數據位/8 */ view.setUint32(offset, sampleRateTmp * channelCount * (sampleBits / 8), true); offset += 4; /* 快數據調整數 採樣一次佔用字節數 通道數×每樣本的數據位數/8 */ view.setUint16(offset, channelCount * (sampleBits / 8), true); offset += 2; /* 每樣本數據位數 */ view.setUint16(offset, sampleBits, true); offset += 2; /* 數據標識符 */ writeString(view, offset, 'data'); offset += 4; /* 採樣數據總數,即數據總大小-44 */ view.setUint32(offset, dataLength, true); offset += 4; /* 採樣數據 */ floatTo16BitPCM(view, 44, samples); return view; }
一旦把雙聲道變爲單聲道,數據直接縮小一半了
可是還不夠
除了聲道之外,還有一個能夠縮減的地方就是採樣位數 默認是16位的,咱們改爲8位 又能夠減小一半了
function encodeWAV(samples) { var sampleBits = 8;//16;//這裏改爲8位 var dataLength = samples.length * (sampleBits / 8); var buffer = new ArrayBuffer(44 + dataLength); var view = new DataView(buffer); var sampleRateTmp = sampleRate; var channelCount = 1; var offset = 0; /* 資源交換文件標識符 */ writeString(view, offset, 'RIFF'); offset += 4; /* 下個地址開始到文件尾總字節數,即文件大小-8 */ view.setUint32(offset, /*32這裏地方栗子中的值錯了,可是不知道爲何依然能夠運行成功*/ 36 + dataLength, true); offset += 4; /* WAV文件標誌 */ writeString(view, offset, 'WAVE'); offset += 4; /* 波形格式標誌 */ writeString(view, offset, 'fmt '); offset += 4; /* 過濾字節,通常爲 0x10 = 16 */ view.setUint32(offset, 16, true); offset += 4; /* 格式類別 (PCM形式採樣數據) */ view.setUint16(offset, 1, true); offset += 2; /* 通道數 */ view.setUint16(offset, channelCount, true); offset += 2; /* 採樣率,每秒樣本數,表示每一個通道的播放速度 */ view.setUint32(offset, sampleRateTmp, true); offset += 4; /* 波形數據傳輸率 (每秒平均字節數) 通道數×每秒數據位數×每樣本數據位/8 */ view.setUint32(offset, sampleRateTmp * channelCount * (sampleBits / 8), true); offset += 4; /* 快數據調整數 採樣一次佔用字節數 通道數×每樣本的數據位數/8 */ view.setUint16(offset, channelCount * (sampleBits / 8), true); offset += 2; /* 每樣本數據位數 */ view.setUint16(offset, sampleBits, true); offset += 2; /* 數據標識符 */ writeString(view, offset, 'data'); offset += 4; /* 採樣數據總數,即數據總大小-44 */ view.setUint32(offset, dataLength, true); offset += 4; /* 採樣數據 */ //floatTo16BitPCM(view, 44, samples); floatTo8BitPCM(view, 44, samples);//這裏改成寫入8位的數據 return view; }
8和16的取值範圍不同
對比一下To8和To16的方法
這裏方法是我本身猜的,若是不對還望指出~~~
function floatTo16BitPCM(output, offset, input) { for (var i = 0; i < input.length; i++, offset += 2) { //由於是int16因此佔2個字節,因此偏移量是+2 var s = Math.max(-1, Math.min(1, input[i])); output.setInt16(offset, s < 0 ? s * 0x8000 : s * 0x7FFF, true); } } function floatTo8BitPCM(output, offset, input) { for (var i = 0; i < input.length; i++, offset++) { //這裏只能加1了 var s = Math.max(-1, Math.min(1, input[i])); var val = s < 0 ? s * 0x8000 : s * 0x7FFF; val = parseInt(255 / (65535 / (val + 32768))); //這裏有一個轉換的代碼,這個是我我的猜想的,就是按比例轉換 output.setInt8(offset, val, true); } }
懷着忐忑的心情,啓動網頁...竟然聽的到聲音~竟然成功了!!!
通過這樣以後又減小了一半大小
網頁中錄音組件的採樣率是44100 不知道在哪裏改,查詢了一些資料,未果...
因此又本身猜想了,是否是我把已經緩存的時候按照比例拋棄一些就能夠模擬減小採樣率的操做呢?
好比如今已經緩存的數據大小是40960 是否是我直接間隔一位拋棄一次數據,將數據大小變成20480 就能夠算是採樣率變成22050了呢?
同理,要編程11025只要再拋棄一半的數據?
因此我又作了以下修改
function interleave(inputL, inputR) { var compression = 44100 / 11025; //計算壓縮率 var length = inputL.length / compression; var result = new Float32Array(length); var index = 0, inputIndex = 0; while (index < length) { result[index] = inputL[inputIndex]; inputIndex += compression;//每次都跳過3個數據 index++; } return result; } function encodeWAV(samples) { var dataLength = samples.length; var buffer = new ArrayBuffer(44 + dataLength); var view = new DataView(buffer); var sampleRateTmp = 11025 ;//sampleRate;//寫入新的採樣率 var sampleBits = 8; var channelCount = 1; var offset = 0; /* 資源交換文件標識符 */ writeString(view, offset, 'RIFF'); offset += 4; /* 下個地址開始到文件尾總字節數,即文件大小-8 */ view.setUint32(offset, /*32*/ 36 + dataLength, true); offset += 4; /* WAV文件標誌 */ writeString(view, offset, 'WAVE'); offset += 4; /* 波形格式標誌 */ writeString(view, offset, 'fmt '); offset += 4; /* 過濾字節,通常爲 0x10 = 16 */ view.setUint32(offset, 16, true); offset += 4; /* 格式類別 (PCM形式採樣數據) */ view.setUint16(offset, 1, true); offset += 2; /* 通道數 */ view.setUint16(offset, channelCount, true); offset += 2; /* 採樣率,每秒樣本數,表示每一個通道的播放速度 */ view.setUint32(offset, sampleRateTmp, true); offset += 4; /* 波形數據傳輸率 (每秒平均字節數) 通道數×每秒數據位數×每樣本數據位/8 */ view.setUint32(offset, sampleRateTmp * channelCount * (sampleBits / 8), true); offset += 4; /* 快數據調整數 採樣一次佔用字節數 通道數×每樣本的數據位數/8 */ view.setUint16(offset, channelCount * (sampleBits / 8), true); offset += 2; /* 每樣本數據位數 */ view.setUint16(offset, sampleBits, true); offset += 2; /* 數據標識符 */ writeString(view, offset, 'data'); offset += 4; /* 採樣數據總數,即數據總大小-44 */ view.setUint32(offset, dataLength, true); offset += 4; /* 採樣數據 */ floatTo16BitPCM(view, 44, samples); return view; }
再次懷着忐忑的心情,啓動網頁...竟然聽的到聲音~竟然又成功了
最後把以前的代碼整理封裝一下
(function (window) { //兼容 window.URL = window.URL || window.webkitURL; navigator.getUserMedia = navigator.getUserMedia || navigator.webkitGetUserMedia || navigator.mozGetUserMedia || navigator.msGetUserMedia; var HZRecorder = function (stream, config) { config = config || {}; config.sampleBits = config.sampleBits || 8; //採樣數位 8, 16 config.sampleRate = config.sampleRate || (44100 / 6); //採樣率(1/6 44100) var context = new webkitAudioContext(); var audioInput = context.createMediaStreamSource(stream); var recorder = context.createJavaScriptNode(4096, 1, 1); var audioData = { size: 0 //錄音文件長度 , buffer: [] //錄音緩存 , inputSampleRate: context.sampleRate //輸入採樣率 , inputSampleBits: 16 //輸入採樣數位 8, 16 , outputSampleRate: config.sampleRate //輸出採樣率 , oututSampleBits: config.sampleBits //輸出採樣數位 8, 16 , input: function (data) { this.buffer.push(new Float32Array(data)); this.size += data.length; } , compress: function () { //合併壓縮 //合併 var data = new Float32Array(this.size); var offset = 0; for (var i = 0; i < this.buffer.length; i++) { data.set(this.buffer[i], offset); offset += this.buffer[i].length; } //壓縮 var compression = parseInt(this.inputSampleRate / this.outputSampleRate); var length = data.length / compression; var result = new Float32Array(length); var index = 0, j = 0; while (index < length) { result[index] = data[j]; j += compression; index++; } return result; } , encodeWAV: function () { var sampleRate = Math.min(this.inputSampleRate, this.outputSampleRate); var sampleBits = Math.min(this.inputSampleBits, this.oututSampleBits); var bytes = this.compress(); var dataLength = bytes.length * (sampleBits / 8); var buffer = new ArrayBuffer(44 + dataLength); var data = new DataView(buffer); var channelCount = 1;//單聲道 var offset = 0; var writeString = function (str) { for (var i = 0; i < str.length; i++) { data.setUint8(offset + i, str.charCodeAt(i)); } } // 資源交換文件標識符 writeString('RIFF'); offset += 4; // 下個地址開始到文件尾總字節數,即文件大小-8 data.setUint32(offset, 36 + dataLength, true); offset += 4; // WAV文件標誌 writeString('WAVE'); offset += 4; // 波形格式標誌 writeString('fmt '); offset += 4; // 過濾字節,通常爲 0x10 = 16 data.setUint32(offset, 16, true); offset += 4; // 格式類別 (PCM形式採樣數據) data.setUint16(offset, 1, true); offset += 2; // 通道數 data.setUint16(offset, channelCount, true); offset += 2; // 採樣率,每秒樣本數,表示每一個通道的播放速度 data.setUint32(offset, sampleRate, true); offset += 4; // 波形數據傳輸率 (每秒平均字節數) 單聲道×每秒數據位數×每樣本數據位/8 data.setUint32(offset, channelCount * sampleRate * (sampleBits / 8), true); offset += 4; // 快數據調整數 採樣一次佔用字節數 單聲道×每樣本的數據位數/8 data.setUint16(offset, channelCount * (sampleBits / 8), true); offset += 2; // 每樣本數據位數 data.setUint16(offset, sampleBits, true); offset += 2; // 數據標識符 writeString('data'); offset += 4; // 採樣數據總數,即數據總大小-44 data.setUint32(offset, dataLength, true); offset += 4; // 寫入採樣數據 if (sampleBits === 8) { for (var i = 0; i < bytes.length; i++, offset++) { var s = Math.max(-1, Math.min(1, bytes[i])); var val = s < 0 ? s * 0x8000 : s * 0x7FFF; val = parseInt(255 / (65535 / (val + 32768))); data.setInt8(offset, val, true); } } else { for (var i = 0; i < bytes.length; i++, offset += 2) { var s = Math.max(-1, Math.min(1, bytes[i])); data.setInt16(offset, s < 0 ? s * 0x8000 : s * 0x7FFF, true); } } return new Blob([data], { type: 'audio/wav' }); } }; //開始錄音 this.start = function () { audioInput.connect(recorder); recorder.connect(context.destination); } //中止 this.stop = function () { recorder.disconnect(); } //獲取音頻文件 this.getBlob = function () { this.stop(); return audioData.encodeWAV(); } //回放 this.play = function (audio) { audio.src = window.URL.createObjectURL(this.getBlob()); } //上傳 this.upload = function (url, callback) { var fd = new FormData(); fd.append("audioData", this.getBlob()); var xhr = new XMLHttpRequest(); if (callback) { xhr.upload.addEventListener("progress", function (e) { callback('uploading', e); }, false); xhr.addEventListener("load", function (e) { callback('ok', e); }, false); xhr.addEventListener("error", function (e) { callback('error', e); }, false); xhr.addEventListener("abort", function (e) { callback('cancel', e); }, false); } xhr.open("POST", url); xhr.send(fd); } //音頻採集 recorder.onaudioprocess = function (e) { audioData.input(e.inputBuffer.getChannelData(0)); //record(e.inputBuffer.getChannelData(0)); } }; //拋出異常 HZRecorder.throwError = function (message) { alert(message); throw new function () { this.toString = function () { return message; } } } //是否支持錄音 HZRecorder.canRecording = (navigator.getUserMedia != null); //獲取錄音機 HZRecorder.get = function (callback, config) { if (callback) { if (navigator.getUserMedia) { navigator.getUserMedia( { audio: true } //只啓用音頻 , function (stream) { var rec = new HZRecorder(stream, config); callback(rec); } , function (error) { switch (error.code || error.name) { case 'PERMISSION_DENIED': case 'PermissionDeniedError': HZRecorder.throwError('用戶拒絕提供信息。'); break; case 'NOT_SUPPORTED_ERROR': case 'NotSupportedError': HZRecorder.throwError('瀏覽器不支持硬件設備。'); break; case 'MANDATORY_UNSATISFIED_ERROR': case 'MandatoryUnsatisfiedError': HZRecorder.throwError('沒法發現指定的硬件設備。'); break; default: HZRecorder.throwError('沒法打開麥克風。異常信息:' + (error.code || error.name)); break; } }); } else { HZRecorder.throwErr('當前瀏覽器不支持錄音功能。'); return; } } } window.HZRecorder = HZRecorder; })(window);
<!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <title></title> </head> <body> <div> <audio controls autoplay></audio> <input onclick="startRecording()" type="button" value="錄音" /> <input onclick="stopRecording()" type="button" value="中止" /> <input onclick="playRecording()" type="button" value="播放" /> <input onclick="uploadAudio()" type="button" value="提交" /> </div> <script type="text/javascript" src="HZRecorder.js"></script> <script> var recorder; var audio = document.querySelector('audio'); function startRecording() { HZRecorder.get(function (rec) { recorder = rec; recorder.start(); }); } function stopRecording() { recorder.stop(); } function playRecording() { recorder.play(audio); } function uploadAudio() { recorder.upload("Handler1.ashx", function (state, e) { switch (state) { case 'uploading': //var percentComplete = Math.round(e.loaded * 100 / e.total) + '%'; break; case 'ok': //alert(e.target.responseText); alert("上傳成功"); break; case 'error': alert("上傳失敗"); break; case 'cancel': alert("上傳被取消"); break; } }); } </script> </body> </html>
源碼下載: RecordingDemo.rar
demo默認採用 44100/6 的採樣率 ,原來20秒要4M ,單聲道砍一半 2M ,8位砍一半 1M, 6分之一採樣率 1M/6 170K左右
微信4秒只有4K是怎麼作到的?
宣傳一下本身的qq羣:5946699 (暗號:C#交流) 歡迎喜歡C#,熱愛C#,正在學習C#,準備學習C#的朋友來這裏互相學習交流,共同進步
羣剛建,人很少,可是都是真正熱愛C#的 我也是熱愛C#的 但願你們能夠一塊兒交流,共同進步