Constme-Whisper是OpenAI的Whisper自動語音識別ASR模型的衍生項目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU處理,可以利用GPU加速處理。
本體是個啟動器,需要結合一個語言識別模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相對的速度也更慢。
軟件特點
基于DirectCompute的與供應商無關的GPGPU;該技術的另一個名稱是“Direct3D 11 中的計算著色器”
純C++實現,除了基本的操作系統組件外,沒有運行時依賴關系
比OpenAI的實現快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持緩沖區R16_FLOAT
內置性能探查器,用于測量單個計算著色器的執行時間
內存使用率低
用于音頻處理的媒體基礎,支持大多數音頻和視頻格式(Ogg Vorbis除外), 以及大多數在Windows上運行的音頻捕獲設備(除了一些專業設備,它們只實現ASIO API)。
用于音頻捕獲的語音活動檢測。
易于使用的 COM 樣式 API,nuget 上提供的慣用 C# 包裝器
提供預構建的二進制文件
更新日志
更新了文檔和 GUI 中的模型源 URL
可靠性增強,麥克風捕獲不太可能轉換到“停滯”狀態并丟棄音頻
溫馨提示:本網站所有分享以視頻課程資源為主,視頻中涉及軟件以及素材,有些需要使用者自行下載安裝,資源鏈接失效問題可聯系客服QQ:824986618
升級成為季度會員、年會員、永久會員都可以免費下載,點擊升級會員
聲明:本站所有資源版權均屬于原作者所有,這里所提供資源均只能用于參考學習用,請勿直接商用。若由于商用引起版權糾紛,一切責任均由使用者承擔。如若本站內容侵犯了原著者的合法權益,可聯系我們824986618@qq.com進行處理。