AI Applications Chat AI Cherry Studio Cherry Studio is a desktop client that supports for multiple LLM providers, available on Windows, Mac and Linux. Support for Multiple LLM Providers. Allows creation of multiple Assistants. Enables creation of multiple topics. Allows using multiple models to answer questions in the same conversation. Supports drag-and-drop sorting. Code highlighting. Mermaid chart Cherry Studio (cherry-ai.com) GitHub: https://github.com/kangfenmao/cherry-studio   Chatbox Chatbox支援多款全球最先進的AI大模型服務,支援Windows、Mac和Linux。AI提升工作效率,深受全世界專業人士的好評。 取代難用的 ChatGPT 或其他網頁聊天介面。 可自訂多個不同 AI 助手。 操作介面簡潔又實用。 跨平台支援(Linux/Windows/Mac) 支援 OpenAI/Gemini/Ollama/Groq 等模型 API 支援繁中等多國語言 Chatbox官網 - 辦公學習的AI好助手,官方免費下載 GitHub: https://github.com/Bin-Huang/chatbox   KHOJ Your AI second brain https://khoj.dev/ GitHub: https://github.com/khoj-ai/khoj   Paper AI Elicit - 論文分析 雲端服務,免安裝,零元基本方案 可用中文分析、檢索、比對及總結多個論文。 Elicit: The AI Research Assistant YT: 生成式AI應用課程(I)-如何以超人的速度來進行學術期刊論文研究 - YouTube asXiv 用 Gemini AI 總結 arXiv.org 的論文 Demo: https://asxiv.org/   GitHub: https://github.com/montanaflynn/asxiv   GPT Academic 为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。 GitHub: https://github.com/binary-husky/gpt_academic   Presentation AI Infography App - 5 秒鐘從文字到精美圖形,這款神器堪稱 PPT 殺手 PDF Extractor gptpdf - 使用 OpenAI API 提取 PDF 內容,輸出為 Markdown 格式。  omniparse - PDF to Markdown GitHub: https://github.com/adithya-s-k/omniparse   PDF-Extract-Kit - Layout Detection, Formula Detection, Formula Recognition Marker - Marker converts PDF to markdown quickly and accurately. Video: Marker: This Open-Source Tool will make your PDFs LLM Ready - YouTube Mathpix (cloud) tabled - 提取表格內容 MarkItDown - Microsoft 開發的各種類型檔案轉換成 Markdown 格式,支援指令與 Python API 兩種方式 MinerU - 一站式開源高品質資料提取工具,將PDF轉換成Markdown和JSON格式。 OpenDataLoader PDF - PDF parser for AI data extraction — Extract Markdown, JSON (with bounding boxes), and HTML from any PDF. OCR dots.ocr - 是一款強大的多語言文件解析器,能在單一視覺語言模型中整合版面檢測與內容識別功能,同時維持良好的閱讀順序。儘管其基礎模型僅採用精簡的 1.7B參數大型語言模型架構,仍能達到頂尖技術水準(SOTA)的表現。 GitHub: https://github.com/rednote-hilab/dots.ocr   YT: https://www.youtube.com/watch?v=t_8ZgUIgnLo   🚀重磅开源!本地部署1.7B参数超强OCR大模型dots.ocr!超越GPT-4o和olmOCR!结构化精准提取复杂PDF扫描件!完美识别中英文文档、模糊扫描件与复杂表格!文档解析准确率接近100%! - AI超元域的博客 DeepSeek-OCR - 只有3B參數,採用「光學上下文壓縮」技術,將文字視為圖像,利用視覺token進行壓縮和理解,把長文字轉換成圖像進行處理,極大地降低了計算資源消耗。 GitHub: https://github.com/deepseek-ai/DeepSeek-OCR   GitHub: https://github.com/deepseek-ai/DeepSeek-OCR-2   HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR   HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR-2   YT: https://www.youtube.com/watch?v=9oICqbApvTg   🚀DeepSeek又放大招!这个OCR模型让文档识别效率倍增!本地部署+客观实测DeepSeek-OCR!OCR识别准确率97%,支持100+语言,每天处理3300万页文档的开源大模型! - AI超元域的博客 OCRFlux is a multimodal large language model based toolkit for converting PDFs and images into clean, readable, plain Markdown text. olmOCR - 支持結構化精准提取復雜PDF文件內容!完美識別中英文文檔、模糊掃描件與復雜表格!本地部署與實際測試全過程!醫療法律行業必備!輕松應對企業級PDF批量轉換需求 GH: https://github.com/allenai/olmocr Demo: https://olmocr.allenai.org/ 🚀本地部署最强OCR大模型olmOCR!支持结构化精准提取复杂PDF文件内容!完美识别中英文文档、模糊扫描件与复杂表格!本地部署与实际测试全过程!医疗法律行业必备!轻松应对企业级PDF批量转换需求! - AI超元域的博客   YT: https://www.youtube.com/watch?v=XF3Q_ZjwfaI   Mistral OCR 3 - 雲端商用服務,可提取 PDF/Image 格式文件,手寫中文辨識不佳;中文印刷字體辨識沒問題。 Paddle OCR - 百度的開源文件解析模型 PaddleOCR-VL-1.5 GitHub: https://github.com/PaddlePaddle/PaddleOCR   HF: https://huggingface.co/spaces/PaddlePaddle/PaddleOCR-VL-1.5_Online_Demo   Zerox OCR - 上傳檔案 ➜ 轉成圖片序列 ➜ 交給視覺模型分析 ➜ 輸出 Markdown ,支援 PDF/DOCX/Excel/PPT等格式,內建 JSON Schema 結構化輸出。 MinerU — High-accuracy document parsing engine for LLM · RAG · Agent workflows More AI aidocx 運用 AI 自動生成特定知識的技術書籍(*.epub) aidocx: 知識擷取小幫手 :: Learn with AI (learninfun.github.io) GitHub: learninfun/aidocx: A tool to extract knowledge from AI (github.com) WrenAI - text-to-SQL WrenAI is a text-to-SQL solution for data teams to get results and insights faster by asking business questions without writing SQL. GitHub: https://github.com/Canner/WrenAI   QAnything 開源的企業級本地知識庫問答及應用 QAnything Doc: https://qanything.ai/docs/introduce   GitHub: https://github.com/netease-youdao/QAnything   PageLM PageLM 是由開源社區 CaviraOSS 發起并維護的一個社區驅動項目,它在設計理念上受到了 Google NotebookLM 的啓發,但走出了一條完全不同的路徑——開源、免費、多模型支持。 GitHub: https://github.com/CaviraOSS/PageLM   Vane (Perplexica) 平替 Perplexity 的自架方案 GitHub: https://github.com/ItzCrazyKns/Vane   Open Notebook 平替 Google NotebookLM GitHub: https://github.com/lfnovo/open-notebook