Recursos - Entrada de voz com IA

Tudo o que faz do OpenTypeless a melhor ferramenta de entrada de voz para seu desktop

Traga Seus Próprios Provedores

Configure seus próprios provedores de STT e polimento por IA com suas chaves API. 6 STT + 11 provedores LLM suportados. Troque a qualquer momento sem perder suas configurações — sem dependência de fornecedor.

O OpenTypeless suporta Deepgram, OpenAI Whisper, Groq Whisper, GLM-4-Voice, AssemblyAI e SiliconFlow como provedores de voz para texto. Cada provedor tem pontos fortes diferentes: Deepgram oferece a menor latência (cerca de 300ms), Groq Whisper fornece o melhor nível gratuito e OpenAI Whisper entrega a maior precisão para áudio complexo. Você pode trocar de provedor a qualquer momento no painel de configurações.

Polimento de Texto com IA

Conecte-se a 11 provedores LLM para refinar automaticamente suas transcrições. Corrija gramática, melhore a formatação, ajuste o tom — tudo em tempo real enquanto você fala.

Os provedores LLM suportados incluem OpenAI GPT, DeepSeek, Google Gemini, Anthropic Claude, Moonshot, Qwen, Zhipu GLM, Yi, Ollama (local), LM Studio (local) e Groq. A etapa de polimento é executada após a transcrição para corrigir pontuação, remover palavras de preenchimento, corrigir gramática e formatar o texto profissionalmente. Você pode personalizar o prompt de polimento para combinar com seu estilo de escrita ou adicionar instruções de tradução.

99 Idiomas com Detecção Automática

Fale em qualquer um dos 99 idiomas suportados. O OpenTypeless detecta automaticamente seu idioma ou permite definir um preferido. Powered by Whisper — perfeito para fluxos de trabalho multilíngues.

O suporte a idiomas é alimentado pelo OpenAI Whisper, cobrindo 99 idiomas incluindo inglês, chinês, japonês, coreano, espanhol, francês, alemão, árabe, hindi e muitos mais. A detecção automática analisa os primeiros segundos da fala para identificar o idioma. Usuários multilíngues podem definir um idioma preferido para pular a detecção e reduzir a latência.

ENEnglish
ZH中文
JA日本語
KO한국어
ESEspañol
FRFrançais
DEDeutsch
PTPortuguês
RUРусский
+13 more

Atalho Global — Funciona em Qualquer Lugar

Um atalho de teclado ativa a entrada de voz de qualquer aplicativo. Sem trocar de janela, sem clicar. Apenas pressione, fale e seu texto aparece no cursor.

A tecla de atalho global funciona em todos os aplicativos de desktop — editores de texto, navegadores, apps de chat, clientes de e-mail, IDEs e mais. No Windows, macOS e Linux, você pode personalizar a combinação de teclas. O atalho alterna a gravação: pressione uma vez para começar a falar e outra para parar. O texto transcrito e polido é colado automaticamente na posição do cursor.

Alt
Space
Hold to Talk
Toggle

Dicionário Personalizado

Adicione termos técnicos, nomes de produtos e vocabulário especializado. A IA aprende seu jargão e acerta sempre.

O dicionário personalizado é especialmente útil para desenvolvedores, profissionais médicos, especialistas jurídicos e qualquer pessoa que trabalhe com terminologia especializada. Adicione nomes de empresas, acrônimos técnicos ou jargão específico do domínio. As entradas são enviadas ao LLM como contexto durante o polimento, garantindo que termos como Kubernetes ou PostgreSQL sejam escritos corretamente.

WordPronunciation
+ Add
Kuberneteskoo-ber-NEH-teez
PostgreSQLpost-GRES-kew-ell
IstioIS-tee-oh

Privacidade em Primeiro Lugar

Suas chaves API ficam na sua máquina. O áudio é enviado diretamente ao provedor escolhido — nunca vemos ou armazenamos seus dados. Totalmente código aberto para transparência.

O OpenTypeless é construído com arquitetura de privacidade em primeiro lugar. O app roda localmente usando Tauri (Rust + React). Suas chaves API são armazenadas em um arquivo local criptografado e nunca são transmitidas aos nossos servidores. Os dados de áudio fluem diretamente do seu microfone para o provedor STT selecionado. Todo o código é open source sob a Licença MIT.

STT Keysk-****...7x2f
LLM Keysk-****...m9kp
💻Stored locally
🔗Direct to provider
🔒We never see your data

Perguntas Frequentes

Perguntas comuns sobre os recursos e capacidades do OpenTypeless

Preciso de conexão com a internet para usar o OpenTypeless?

Você precisa de conexão com a internet para provedores STT e LLM na nuvem. No entanto, se usar Ollama ou LM Studio como provedor LLM e um modelo Whisper local, pode executar o OpenTypeless completamente offline. O app desktop roda localmente e não depende dos nossos servidores.

Qual provedor STT devo escolher?

Depende das suas prioridades. Deepgram oferece os tempos de resposta mais rápidos (cerca de 300ms), ideal para uso em tempo real. Groq Whisper tem um nível gratuito generoso. OpenAI Whisper tem a melhor precisão em ambientes ruidosos. AssemblyAI se destaca na diarização. Você pode testar cada provedor e trocar a qualquer momento sem perder configurações.

Posso usar o OpenTypeless para tradução?

Sim. Você pode falar em um idioma e fazer o passo de polimento AI traduzir seu texto para outro idioma. Por exemplo, fale em chinês e obtenha texto polido em inglês. Configure adicionando instruções de tradução ao seu prompt de polimento personalizado nas configurações.

O OpenTypeless é realmente gratuito?

O app desktop é completamente gratuito e open source sob a Licença MIT. Você traz suas próprias chaves API para provedores STT e LLM, e muitos oferecem níveis gratuitos generosos. O uso típico custa menos de $1/mês em API. O plano Pro opcional ($4.99/mês) fornece STT e LLM pré-configurados sem necessidade de chaves API.

Quais plataformas o OpenTypeless suporta?

O OpenTypeless roda no Windows 10 ou posterior (64 bits), macOS 12 Monterey ou posterior, e Linux (Ubuntu 20.04+, Fedora 36+, Arch Linux). É construído com Tauri, oferecendo desempenho nativo nas três plataformas. Você também pode compilar a partir do código-fonte se sua distribuição não for oficialmente suportada.