Constme-Whisper是OpenAI的Whisper自動語音識別ASR模型的衍生項(xiàng)目。

Constme-Whisper可以在Windows上使用,支持高性能GPGPU處理,可以利用GPU加速處理。

本體是個啟動器,需要結(jié)合一個語言識別模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相對的速度也更慢。

軟件特點(diǎn)

基于DirectCompute的與供應(yīng)商無關(guān)的GPGPU;該技術(shù)的另一個名稱是“Direct3D 11 中的計(jì)算著色器”
純C++實(shí)現(xiàn),除了基本的操作系統(tǒng)組件外,沒有運(yùn)行時依賴關(guān)系
比OpenAI的實(shí)現(xiàn)快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持緩沖區(qū)R16_FLOAT
內(nèi)置性能探查器,用于測量單個計(jì)算著色器的執(zhí)行時間
內(nèi)存使用率低
用于音頻處理的媒體基礎(chǔ),支持大多數(shù)音頻和視頻格式(Ogg Vorbis除外), 以及大多數(shù)在Windows上運(yùn)行的音頻捕獲設(shè)備(除了一些專業(yè)設(shè)備,它們只實(shí)現(xiàn)ASIO API)。
用于音頻捕獲的語音活動檢測。
易于使用的 COM 樣式 API,nuget 上提供的慣用 C# 包裝器
提供預(yù)構(gòu)建的二進(jìn)制文件

Constme-Whisper(離線語音識別) v1.12

更新日志

更新了文檔和 GUI 中的模型源 URL
可靠性增強(qiáng),麥克風(fēng)捕獲不太可能轉(zhuǎn)換到“停滯”狀態(tài)并丟棄音頻

本站所有資源版權(quán)均屬于原作者所有,這里所提供資源均只能用于參考學(xué)習(xí)用,請勿直接商用。若由于商用引起版權(quán)糾紛,一切責(zé)任均由使用者承擔(dān)。

最常見的情況是下載不完整: 可對比下載完壓縮包的與網(wǎng)盤上的容量,若小于網(wǎng)盤提示的容量則是這個原因。這是瀏覽器下載的bug,建議用百度網(wǎng)盤軟件或迅雷下載。 若排除這種情況可聯(lián)絡(luò)站長QQ:824986618。

如果您已經(jīng)成功付款但是網(wǎng)站沒有彈出成功提示,請聯(lián)系站長提供付款信息為您處理

教程資源屬于虛擬商品,具有可復(fù)制性,可傳播性,一旦授予,不接受任何形式的退款、換貨要求,請您在購買獲取之前確認(rèn)好是您所需要的資源。充值也好,購買會員也一樣,最終解釋權(quán)歸本站所有。