No dia 7 de janeiro, um terremoto de magnitude 6,8 atingiu o condado de Tingri, no Tibete, e muitas pessoas estão preocupadas com o progresso dos esforços de resgate e rezando pela segurança das áreas afetadas. Enquanto isso, em meio à boa vontade e à preocupação das pessoas, uma foto de um "garotinho enterrado sob os escombros" rapidamente se tornou popular na Internet. Essa imagem foi acompanhada das palavras "Terremoto Rikaze", provocando lágrimas em inúmeras pessoas, mas também...
Lançamos o vdr-2b-multi-v1, o melhor modelo de incorporação multilíngue para recuperação de documentos visuais. Também lançamos sua versão somente em inglês, vdr-2b-v1, e abrimos o novo conjunto de dados vdr-multilingual-train. Esse conjunto de dados contém 500.000 amostras de alta qualidade e é o melhor modelo de incorporação multilíngue para recuperação de...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
✨ Revelados os segredos do Little Red Book Nuggets! 🔥 Projetos de alho-poró podem ser divertidos? Há também tutoriais de operação gratuitos! Olá a todos, recentemente descobri que todos estão muito interessados nos projetos relacionados ao pequeno livro vermelho, parece que todos querem cavar ouro no pequeno livro vermelho neste mar azul ah! 🚀 Não se preocupe, hoje eu trago para você...
Agent AI: Surveying the Horizons of Multimodal Interaction Publicado originalmente em https://ar5iv.labs.arxiv.org/html/2401.03568 Resumo É provável que os sistemas de IA multimodal sejam onipresentes em nosso cotidiano. Uma maneira de tornar esses sistemas mais interativos ...
Introdução geral O Cursor Auto-Free é um projeto de código aberto desenvolvido pelo usuário do GitHub chengazhen para automatizar o login para obter serviços gratuitos para o IDE Cursor. O Cursor é um editor de código com funcionalidade de IA integrada e, com essa ferramenta, os usuários podem se inscrever automaticamente e obter um período de teste gratuito...
Tutorial prático de trabalho de automação do Coze (Button) Introdução No ambiente de trabalho moderno, a tecnologia de automação está se tornando uma ferramenta importante para que as empresas aumentem a produtividade com sua eficiência, precisão e escalabilidade. O **Coze (Button)** é uma ferramenta de automação leve e altamente flexível para vários setores, desde...
Introdução geral O BrownChat é um aplicativo de bate-papo com áudio em tempo real baseado na tecnologia LLM (Large Language Modelling). Desenvolvido pelo usuário do GitHub sugarforever, o projeto tem como objetivo aprimorar a experiência de comunicação do usuário por meio de tecnologia avançada de processamento de linguagem natural.
Introdução abrangente O Xunfei Instrument é uma plataforma de escrita de instrumentos baseada em tecnologia de IA lançada pela Xunfei, com base no modelo grande Xunfei Starfire, projetado para fornecer soluções de escrita eficientes e convenientes para a comunidade de escrita de instrumentos. A plataforma abrange todas as funções do processo, como preparação de material, redação de manuscritos, revisão e verificação, etc., com o objetivo de melhorar o desempenho do usuário...
Introdução abrangente O Lecca é uma poderosa plataforma de IA que permite aos usuários configurar e implementar modelos de linguagem grande (LLMs) com várias ferramentas e fluxos de trabalho. Os usuários podem criar, personalizar e automatizar facilmente seus agentes de IA. O Lecca oferece uma ampla seleção de provedores e modelos de IA, suporta a integração de ferramentas e o fluxo de trabalho...
Descrição geral O Automa é uma poderosa extensão de navegador projetada para simplificar as tarefas repetitivas do usuário no navegador, automatizando as ações. Seja no preenchimento automático de formulários, na captura de telas, na extração de dados ou na execução de fluxos de trabalho complexos, a Automa pode lidar com isso com facilidade. Os usuários podem conectar diferentes módulos para criar...
Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece uma interface de aplicativo da Web Streamlit fácil de usar. Ele oferece suporte a vários ...
Introdução abrangente O FitDiT é um sistema de ajuste virtual de alta fidelidade baseado em transformadores de difusão (Diffusion Transformers). Desenvolvido pelo Tencent AI Lab, o projeto tem como objetivo abordar as limitações dos sistemas de ajuste virtual tradicionais na exibição de detalhes do vestuário.
Introdução abrangente O Avatarify Python é uma ferramenta de videoconferência de inteligência artificial de código aberto baseada na tecnologia First Order Motion Model que mapeia as expressões faciais e os movimentos dos usuários para qualquer avatar em tempo real. Ele é compatível com o Zoom, Skype, Teams e outros tipos de software de videoconferência, permitindo o uso...
Introdução geral O FaceSwap é uma ferramenta de troca de rostos de aprendizado profundo de código aberto que reconhece e troca rostos em imagens e vídeos. O projeto é desenvolvido pela comunidade, escrito em Python e é compatível com várias plataformas de sistemas operacionais, como Windows, Linux e macOS.O FaceSwap utiliza técnicas de aprendizagem profunda,...
No rápido desenvolvimento da IA, os Humanos Digitais (Digital Humans) amadureceram e podem ser gerados rapidamente a baixo custo. Devido à ampla gama de cenários de aplicação comercial, eles têm recebido atenção. Seja em realidade virtual (VR), realidade aumentada (AR) ou produção de filmes e televisão, desenvolvimento de jogos, promoção de marcas, os humanos digitais são...
Introdução geral O Thin-Plate-Spline-Motion-Model é um projeto inovador de geração de animação de imagens apresentado na CVPR 2022. O projeto baseia-se na teoria das transformações de spline de placa fina e é capaz de obter animação de alta qualidade de imagens estáticas com base em vídeo de unidade. O projeto usa uma estrutura de aprendizado não supervisionado de ponta a ponta ...
Introdução geral O DUIX (Dialogue User Interface System) é uma plataforma de interação humana digital orientada por IA criada pela Silicon Intelligence. Com recursos de interação humana digital de código aberto, os desenvolvedores podem integrar facilmente a modelagem em larga escala, o reconhecimento automático de fala (ASR) e os recursos de conversão de texto em fala (TTS) para obter interação com...
Introdução abrangente O Fay é uma estrutura humana digital virtual 3D de código aberto que integra modelos de linguagem e caracteres digitais para uma variedade de cenários de aplicativos, como guias de compras virtuais, âncoras virtuais, assistentes, garçons, professores e assistentes móveis baseados em voz ou texto.
Introdução geral O MOFA-Video é uma ferramenta avançada de geração de animação de imagens que usa técnicas generativas de adaptação de campo de movimento para converter imagens estáticas em vídeos dinâmicos. Ela foi desenvolvida em colaboração com a Universidade de Tóquio e o Tencent AI Lab e será apresentada na Conferência Europeia sobre Visão Computacional (ECCV) 2024.
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.