
Surya:专业多语言文档OCR工具,开源本地部署
综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型的文档,包括P...
综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型的文档,包括P...
因国内部署无法访问hugging face,所以在大佬部署方案的基础上改造成能部署到cloudflare workers。 准备工作 1、注册 cloudflare 2、注册hugging face并申请api key,申请api key地址 3、复制以下代码部署...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Inbox Zero 是一个开源的邮件管理应用,旨在通过 AI 助手帮助用户快速实现收件箱零邮件。该应用提供了多种功能,包括自动回复、归档、标签和转发邮件,管理和退订新闻通讯,阻止冷邮件,跟踪邮件活动等...
综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加密算法和数...
综合介绍 小猿口算自动答题工具是一个基于Python的开源项目,旨在通过OCR识别和自动化脚本来高效解决小猿口算应用中的题目。该工具利用了OpenCV和Tesseract等技术,能够实时识别屏幕上的题目并自动填写答案,极大...
综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人,支持 OpenAI、Claude、Azure 等多个 API。该项目采用 TypeScript 开发,模块化设计便于扩展,提供快速、可扩展的服务...
综合介绍 Cloud Document Converter 是一个 Chrome 扩展,专为将飞书云文档转换为 Markdown 格式而设计。用户可以通过该工具轻松下载或复制飞书云文档为 Markdown 文件,方便进行二次编辑和分享。该工具支持多种 ...
综合介绍 QuickPiperAudiobook 是一个开源项目,旨在通过简单的一条命令,将各种文本格式(如 epub、mobi、txt、PDF、HTML 等)转换为自然音质的有声书。该工具使用 Piper 模型进行转换,并管理 Piper 的安装和相...
综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具,专为大型语言模型(LLMs)和人工智能(AI)应用设计。它简化了网络爬虫和数据提取流程,支持高效的网页爬取,并提供对 LLM 友好的输出格式,如 JSON、清理过的 ...
综合介绍 Cloudflare Serverless Registry 是一个基于 Cloudflare Workers 和 R2 存储的无服务器容器注册表。它支持镜像的推送和拉取,并提供用户名密码和基于公钥的 JWT 认证。该项目易于部署,兼容 Docker 操作...
综合介绍 Auto_Jobs_Applier_AIHawk 是一款利用人工智能技术自动化求职的工具。它能够帮助用户在短时间内自动投递大量简历,并根据用户的个人信息和求职意向进行个性化调整。该工具旨在提高求职效率,减少手动投...
综合介绍 simple-one-api 是一个开源项目,旨在简化多种大模型API的集成。它支持千帆大模型平台、讯飞星火大模型、腾讯混元以及 MiniMax 和 Deep-Seek 等兼容 OpenAI 接口的模型。该项目仅需一个可执行文件,配置...
综合介绍 Voice Changer 是一个开源的实时语音变换工具,支持多种 AI 语音模型,如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台,包括 Windows、Mac、Linux 和 Google Colab,用户可以通...
综合介绍 VoAPI 是一个全新的高颜值、高性能的 AI 模型接口管理与分发系统,主要用于个人或企业内部的管理与分发渠道。该系统基于 NewAPI 开发,提供了丰富的功能模块和优化的用户界面,旨在提升用户体验和操作效...
综合介绍 MockingBird 是一个开源项目,旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本,即可生成任意语音内容。该项目支持多种中文数据集,并在 Windows 和 Linux 系统上运行良好...
综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应用程序在本地运行。它支...
综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧密对应,并保持高帧质...
综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现,适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确遵循文本提示的视频的新方法。团队也发布...
综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点...