WhisperDesktop1.8双向音频转文字软件(音频转文字程序)

WhisperDesktop1.8双向音频转文字软件可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux(目前界面只有英文的,但支持中文的转换)

更新时间:2023-06-09

访问次数:119

详细介绍

可实现本地电脑的音频转文字软件!双向转换,完全免费开源!支持 Windows、macOS、Linux(目前界面只有英文的,但支持中文的转换)
 

WhisperDesktop1.8双向音频转文字软件特点:

1. 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
2. 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
比 OpenAI 的实现快得多。
3. 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要缓冲区 的支持R16_FLOAT。
4. 内置性能分析器,可测量单个计算着色器的执行时间内存使用率低
5. 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(--color-accent-fg)]。
6. 用于音频捕获的语音活动检测。

WhisperDesktop1.8双向音频转文字软件(音频转文字程序)

使用步骤:

1. 下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型)

2. 解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型

3. 加载完成后,就可以进行语音转文了

4. 结果以文本格式输入。

5. 另外一个功能是允许从麦克风捕获和转录或翻译实时音频

WhisperDesktop1.8双向音频转文字软件资源:

ggml-medium 语音模型(官方):
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

 

网友评论