功能 - AI 语音输入与文本润色

让 OpenTypeless 成为最佳 Typeless 替代品的一切

自带供应商

用你自己的 API 密钥配置 STT 和 AI 润色供应商。支持 6 个 STT + 11 个 LLM 供应商。随时切换,不丢失设置,无供应商锁定。

OpenTypeless 支持 Deepgram、OpenAI Whisper、Groq Whisper、GLM-4-Voice、AssemblyAI 和 SiliconFlow 作为语音转文字供应商。每个供应商各有优势:Deepgram 延迟最低(约 300ms),Groq Whisper 免费额度最大,OpenAI Whisper 在复杂音频环境下准确率最高。你可以随时在设置面板中切换供应商,无需重新配置工作流。

AI 驱动的文本润色

连接 11 个 LLM 供应商,自动优化你的转录。修正语法、改善格式、调整语气 — 全部实时完成。

支持的 LLM 供应商包括 OpenAI GPT、DeepSeek、Google Gemini、Anthropic Claude、Moonshot、通义千问、智谱 GLM、零一万物、Ollama(本地)、LM Studio(本地)和 Groq。润色步骤在转录后运行,修正标点、删除语气词、纠正语法,并将文本格式化为专业用途。你可以自定义润色提示词以匹配你的写作风格或添加翻译指令。

99 种语言,自动检测

用 99 种支持的语言说话。OpenTypeless 自动检测你的语言或让你设置首选语言。基于 Whisper — 完美适配多语言工作流。

语言支持基于 OpenAI Whisper,覆盖 99 种语言,包括英语、中文、日语、韩语、西班牙语、法语、德语、阿拉伯语、印地语等。自动检测功能通过分析语音的前几秒来识别语言。对于频繁切换语言的多语言用户,你可以设置首选语言以跳过检测并减少延迟。

ENEnglish
ZH中文
JA日本語
KO한국어
ESEspañol
FRFrançais
DEDeutsch
PTPortuguês
RUРусский
+13 more

全局快捷键 — 随处可用

一个键盘快捷键即可在任何应用中激活语音输入。无需切换窗口,无需点击。按下、说话,文本就出现在光标处。

全局快捷键在所有桌面应用中系统级别生效 — 文本编辑器、浏览器、聊天应用、邮件客户端、IDE 等。在 Windows、macOS 和 Linux 上,你可以在设置中自定义快捷键组合。快捷键切换录制开关,按一次开始说话,再按一次停止。转录和润色后的文本会自动粘贴到光标位置。

Alt
Space
Hold to Talk
Toggle

自定义词典

添加技术术语、产品名称和专业词汇。AI 学习你的行话,每次都能正确识别。

自定义词典对开发者、医疗专业人员、法律专家以及任何使用专业术语的人特别有用。添加公司名称、技术缩写、产品名称或领域专用术语。词典条目在润色步骤中作为上下文发送给 LLM,确保 Kubernetes、PostgreSQL 或你公司的产品名称始终拼写正确。

WordPronunciation
+ Add
Kuberneteskoo-ber-NEH-teez
PostgreSQLpost-GRES-kew-ell
IstioIS-tee-oh

隐私优先

你的 API 密钥保存在本地。音频直接发送到你选择的供应商 — 我们从不查看或存储你的数据。完全开源,透明可信。

OpenTypeless 采用隐私优先架构。桌面应用基于 Tauri(Rust + React)在本地运行。你的 API 密钥存储在本地加密配置文件中,永远不会传输到我们的服务器。音频数据直接从麦克风流向你选择的 STT 供应商。整个代码库在 MIT 许可证下开源,你可以自行审计每一行代码。

STT Keysk-****...7x2f
LLM Keysk-****...m9kp
💻Stored locally
🔗Direct to provider
🔒We never see your data

常见问题

关于 OpenTypeless 功能和能力的常见问题

使用 OpenTypeless 需要联网吗?

使用云端 STT 和 LLM 供应商时需要联网。但如果你使用 Ollama 或 LM Studio 作为 LLM 供应商并搭配本地 Whisper 模型,可以完全离线运行 OpenTypeless。桌面应用本身在本地运行,不依赖我们的服务器。

我应该选择哪个 STT 供应商?

取决于你的优先级。Deepgram 响应速度最快(约 300ms),适合实时使用。Groq Whisper 免费额度大且准确率好。OpenAI Whisper 在噪音环境下准确率最高。AssemblyAI 擅长说话人分离。你可以尝试每个供应商,随时切换而不丢失设置。

OpenTypeless 可以用于翻译吗?

可以。你可以用一种语言说话,让 AI 润色步骤将文本翻译成另一种语言。例如,用中文说话,获得润色后的英文输出。在设置中的自定义润色提示词中添加翻译指令即可配置。

OpenTypeless 真的免费吗?

桌面应用完全免费且在 MIT 许可证下开源。你自带 STT 和 LLM 供应商的 API 密钥,许多供应商提供大方的免费额度。典型语音输入使用每月 API 费用不到 1 美元。可选的 Pro 计划($4.99/月)提供预配置的云端 STT 和 LLM,无需管理自己的 API 密钥。

OpenTypeless 支持哪些平台?

OpenTypeless 运行在 Windows 10 及更高版本(64 位)、macOS 12 Monterey 及更高版本、以及 Linux(Ubuntu 20.04+、Fedora 36+、Arch Linux)。应用基于 Tauri 构建,在三个平台上都提供原生性能。如果你的发行版未被官方支持,也可以从源码构建。