Introdução geral
O Aqua Voice é uma ferramenta inteligente de geração de texto baseada em fala, focada na conversão rápida da fala do usuário em texto formatado. Fundada em 2023 por Finnian Brown e Jack McIntire, e com sede em São Francisco, EUA, como parte do programa de incubação Y Combinator W24, a Aqua Voice não apenas transcreve a fala com precisão, mas também entende a intenção do usuário com base no contexto, formatando automaticamente o texto para gerar conteúdo como e-mails, códigos ou mensagens. Ele é ágil, com um tempo de inicialização inferior a 200 milissegundos, uma latência de saída de texto tão baixa quanto 450 milissegundos e uma taxa de erro cerca de 17 vezes menor do que a entrada de voz da Siri e do Google. Com suporte para Mac e Windows, ele pode ser usado em uma grande variedade de aplicativos sem plug-ins adicionais, o que o torna ideal para usuários que precisam trabalhar com texto de forma eficiente.
Lista de funções
- Transcrição de fala de alta precisãoConverte a fala em texto em tempo real, corrigindo automaticamente a ortografia, a gramática e a formatação.
- ensino de linguagem naturalAjuste o texto com instruções verbais simples, como "mudar para lista" ou "inserir tabela".
- sensível ao contextoInformações complementares inteligentes ou otimização da saída com base no conteúdo da tela ou no contexto do documento.
- latência ultrabaixaTempo de inicialização: menos de 200 milissegundos, com um atraso de saída no modo rápido de aproximadamente 450 milissegundos.
- modo de transmissãoSuporte para entrada de voz contínua com uma latência de aproximadamente 850 milissegundos para tarefas complexas.
- Compatibilidade entre aplicativosInsira texto diretamente em aplicativos como Notion, Slack, VSCode e outros sem um plug-in.
- Compreensão do códigoOtimize a transcrição relacionada ao código para desenvolvedores, com suporte para realce de sintaxe e correção de terminologia.
- Dicionário personalizadoAdicionar vocabulário proprietário (por exemplo, nomes, termos técnicos) para garantir uma transcrição precisa.
- PrivacidadeDados: Os dados são processados localmente e nenhum dado do usuário é armazenado para proteger a privacidade e a segurança.
Usando a Ajuda
Processo de instalação
- Visite o site oficial https://withaqua.com/ e clique no botão "Download" na parte superior da página.
- Escolha a versão de acordo com seu sistema operacional:
- Os usuários de Mac escolhem a versão Apple Silicon ou Intel.
- Os usuários do Windows baixam diretamente o pacote de instalação genérico.
- Quando o download estiver concluído, clique duas vezes no pacote de instalação e siga as instruções para concluir a instalação. Normalmente, todo o processo leva apenas de 3 a 5 minutos.
- Inicie o Aqua Voice e o software detectará automaticamente o microfone e solicitará uma conexão. Se tiver algum problema, consulte as perguntas frequentes no site oficial para obter soluções.
- Os usuários iniciantes precisam se inscrever para criar uma conta, e a versão gratuita oferece uma avaliação de 1.000 palavras. Após a avaliação, você pode optar por assinar a versão Pro (US$ 10 por mês ou US$ 96 por ano).
Como usar
No centro do Aqua Voice está a capacidade de gerar e editar rapidamente texto por voz, o que é fácil de usar e adequado para uma ampla gama de cenários. Veja abaixo um guia detalhado de como usá-lo:
Entrada de voz básica
- Abra o Aqua Voice e clique no ícone do microfone ou pressione a tecla de atalho padrão
Ctrl+Space
(Personalizável) Inicia a gravação. - Diga algo como "Escreva um e-mail para Sarah explicando que a reunião de amanhã foi cancelada". O software gera o texto formatado:
主题:会议取消通知
亲爱的 Sarah,
明天原定的会议已取消,请知悉。谢谢!
- As pausas curtas são segmentadas automaticamente, e pressionar longamente o ícone do microfone encerra a gravação.
Uso de instruções em linguagem natural
O Aqua Voice suporta a formatação de texto com comandos simples. Por exemplo:
- Diga "change to list" e o texto será alterado:
- 明天原定的会议已取消
- 请知悉
- Diga "Insert Form" (Inserir formulário) para gerar:
| 任务 | 状态 |
|----------|--------|
| 会议 | 取消 |
- Quando você disser "encurtar este parágrafo", o software simplificará o texto, por exemplo, substituindo "Favor confirmar o recebimento" por "Favor confirmar".
As instruções devem ser claras e evitar declarações complexas. Por exemplo, "Torne esta parte mais concisa" é mais facilmente reconhecido do que "Otimize a estrutura do texto".
Uso entre aplicativos
O Aqua Voice funciona em vários aplicativos sem plug-ins:
- No Slack, Notion ou Gmail, pressione a tecla de atalho para ativar o Aqua Voice.
- Diga algo como "Responda ao John e diga a ele que o projeto está concluído". O software o registrará diretamente:
嗨 John,项目已经完成,请确认。
- Uma vez concluído, você pode enviá-lo manualmente ou dizer "Send" (Enviar) para acionar a função de envio no aplicativo (é necessário suporte ao aplicativo).
Operação da função em destaque
- sensível ao contexto
O Aqua Voice entende o contexto por meio do conteúdo na tela. Por exemplo:
- Diga "add comment" (adicionar comentário) ao escrever o código, e ele gerará algo como
// 初始化用户数据
As anotações. - No e-mail, diga "Fill in the date" (Preencha a data) e ele inserirá a data atual, por exemplo, "10 April 2025" (10 de abril de 2025).
- Se o nome de uma pessoa for mencionado (por exemplo, "Tom"), ele fará referência à lista de contatos na tela para minimizar erros de ortografia.
- Compreensão de código e destaque de sintaxe
Para os desenvolvedores, o Aqua Voice reconhece termos técnicos e otimiza a produção:
- Dizer "Criar função getUserData, aceitando o parâmetro ID" gerará:
async function getUserData(id) { const response = await fetch(`/users/${id}`); return response.json(); }
- Corrige automaticamente a terminologia, como a alteração de "Jason" para "JSON".
- Modo de streaming vs. modo rápido
- modo rápido(Modo instantâneo): adequado para a entrada de frases curtas com um atraso de cerca de 450 milissegundos. O texto é emitido imediatamente após ser falado.
- modo de transmissão(Modo de fluxo contínuo): para parágrafos longos ou tarefas complexas, com um atraso de cerca de 850 ms. Gerar como você fala, adequado para ditar documentos longos.
- Alternar modo: Selecione nas configurações ou diga "Alternar para o modo de streaming".
- Dicionário personalizado
- Adicione palavras proprietárias, como "Grok" ou "xAI", às suas configurações para garantir uma transcrição precisa.
- Exemplo: depois de adicionar "Grok", diga "Grok is an AI assistant" (Grok é um assistente de IA), que não será escrito incorretamente como "Grock".
- Privacidade e segurança
- Todos os dados de voz são processados localmente e não são carregados na nuvem.
- A análise do contexto da tela é usada apenas para otimizar a saída e nenhuma informação é armazenada.
advertência
- Certifique-se de que o microfone seja de boa qualidade para evitar que o ruído de fundo interfira na precisão da transcrição.
- No momento, a entrada de voz em inglês e chinês não é compatível por enquanto, mas a equipe de desenvolvimento disse que está desenvolvendo recursos em vários idiomas.
- A conectividade de rede melhora a percepção do contexto, mas o modo off-line funciona bem para funções básicas.
- Verifique regularmente o site oficial https://withaqua.com/changelog para obter as atualizações mais recentes e o software solicitará automaticamente novas versões.
habilidade avançada
- Formatação de documentos complexos:: Diga "Format as Report", que gera um texto estruturado com título, corpo e conclusão.
- multitarefaNo modo de transmissão, diga "Escreva um e-mail para Anna explicando seus planos; em seguida, crie uma lista de tarefas" e o software fará isso por sua vez.
- Otimização de atalhos: Ajuste os atalhos nas configurações, por exemplo, definindo o
Ctrl+Space
mudar paraAlt+V
aumentar a eficiência operacional.
Com esses recursos, os usuários podem usar facilmente a voz para concluir edições de mensagens simples a códigos complexos, reduzindo drasticamente o tempo de entrada manual.
cenário do aplicativo
- Comunicação eficaz no local de trabalho
Descrição do cenário: um gerente ocupado precisa responder a vários e-mails entre uma reunião e outra. Economize tempo usando o Aqua Voice para ditar o conteúdo do e-mail e o software gera automaticamente um texto formatado que pode ser enviado diretamente. - Codificação rápida para desenvolvedores
Descrição do cenário: os programadores ditam a lógica do código, como "Criar ponto de extremidade da API REST", e o Aqua Voice gera o trecho exato do código, reduzindo a necessidade de digitação manual. - Anotações do aluno em sala de aula
Descrição do cenário: os alunos gravam palestras por voz e dizem "organize em um esboço" para gerar rapidamente materiais de revisão para facilitar a organização após a aula. - Auxílios de acessibilidade
Descrição do cenário: os usuários que não sabem digitar operam seus computadores convenientemente por voz para concluir o envio de mensagens ou a edição de documentos para melhorar sua vida e eficiência no trabalho.
QA
- O Aqua Voice é compatível com voz em chinês?
Atualmente, apenas o inglês é suportado, a função chinesa está em desenvolvimento. Você pode acompanhar o site oficial https://withaqua.com/blog para obter atualizações. - Quais são as limitações da versão gratuita?
A versão gratuita oferece uma avaliação de 1.000 palavras e 5 espaços de dicionário personalizados. Palavras ilimitadas requerem uma assinatura Pro (US$ 10 por mês). - Como você garante a segurança dos dados?
Os dados de voz e de tela são processados localmente, não são carregados na nuvem, e nenhuma informação é armazenada sem a permissão do usuário. - Em quais aplicações ele pode ser usado?
O Aqua Voice é compatível com Notion, Slack, VSCode, Gmail, WhatsApp, etc. Digite o texto diretamente sem plug-ins adicionais. - Como você lida com termos proprietários?
Adicione dicionários personalizados nas configurações, como nomes de empresas ou termos técnicos, e o software os reconhecerá como prioridade.