# AI Applications

#### Chat AI

##### Cherry Studio

Cherry Studio is a desktop client that supports for multiple LLM providers, available on Windows, Mac and Linux.

> - Support for Multiple LLM Providers.
> - Allows creation of multiple Assistants.
> - Enables creation of multiple topics.
> - Allows using multiple models to answer questions in the same conversation.
> - Supports drag-and-drop sorting.
> - Code highlighting.
> - Mermaid chart

- [Cherry Studio (cherry-ai.com)](https://cherry-ai.com/)
- GitHub: [https://github.com/kangfenmao/cherry-studio](https://github.com/kangfenmao/cherry-studio)

##### Chatbox

Chatbox支援多款全球最先進的AI大模型服務，支援Windows、Mac和Linux。AI提升工作效率，深受全世界專業人士的好評。

> - 取代難用的 ChatGPT 或其他網頁聊天介面。
> - 可自訂多個不同 AI 助手。
> - 操作介面簡潔又實用。
> - 跨平台支援（Linux/Windows/Mac）
> - 支援 OpenAI/Gemini/Ollama/Groq 等模型 API
> - 支援繁中等多國語言

- [Chatbox官網 - 辦公學習的AI好助手，官方免費下載](https://chatboxai.app/zh-TW)
- GitHub: [https://github.com/Bin-Huang/chatbox](https://github.com/Bin-Huang/chatbox)

##### KHOJ

Your AI second brain

- [https://khoj.dev/](https://khoj.dev/)
- GitHub: [https://github.com/khoj-ai/khoj](https://github.com/khoj-ai/khoj)

#### Paper AI

##### Elicit - 論文分析

- 雲端服務，免安裝，零元基本方案
- 可用中文分析、檢索、比對及總結多個論文。
- [Elicit: The AI Research Assistant](https://elicit.com/welcome)
- YT: [生成式AI應用課程(I)-如何以超人的速度來進行學術期刊論文研究 - YouTube](https://www.youtube.com/watch?v=SVaKEr2ePQY&t=4s)

##### asXiv

- 用 Gemini AI 總結 [arXiv.org](https://arxiv.org/) 的論文
- Demo: [https://asxiv.org/](https://asxiv.org/)
- GitHub: [https://github.com/montanaflynn/asxiv](https://github.com/montanaflynn/asxiv)

##### GPT Academic

为GPT/GLM等LLM大语言模型提供实用化交互接口，特别优化论文阅读/润色/写作体验，模块化设计，支持自定义快捷按钮&amp;函数插件，支持Python和C++等项目剖析&amp;自译解功能，PDF/LaTex论文翻译&amp;总结功能，支持并行问询多种LLM模型，支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。

- GitHub: [https://github.com/binary-husky/gpt\_academic](https://github.com/binary-husky/gpt_academic)

#### Presentation AI

- [Infography App](https://app.infography.in) - 5 秒鐘從文字到精美圖形，這款神器堪稱 PPT 殺手

#### PDF Extractor

- [gptpdf](https://github.com/CosmosShadow/gptpdf) - 使用 OpenAI API 提取 PDF 內容，輸出為 Markdown 格式。
- [omniparse](https://docs.cognitivelab.in/) - PDF to Markdown  
    
    - GitHub: [https://github.com/adithya-s-k/omniparse](https://github.com/adithya-s-k/omniparse)
- [PDF-Extract-Kit](https://github.com/opendatalab/PDF-Extract-Kit) - Layout Detection, Formula Detection, Formula Recognition
- [Marker](https://github.com/VikParuchuri/marker) - Marker converts PDF to markdown quickly and accurately. 
    - Video: [Marker: This Open-Source Tool will make your PDFs LLM Ready - YouTube](https://www.youtube.com/watch?v=mdLBr9IMmgI)
- [Mathpix](https://mathpix.com/) (cloud)
- [tabled](https://github.com/VikParuchuri/tabled) - 提取表格內容
- [MarkItDown](https://github.com/microsoft/markitdown) - Microsoft 開發的各種類型檔案轉換成 Markdown 格式，支援指令與 Python API 兩種方式
- [MinerU](https://github.com/opendatalab/MinerU) - 一站式開源高品質資料提取工具，將PDF轉換成Markdown和JSON格式。
- [OpenDataLoader PDF](https://github.com/opendataloader-project/opendataloader-pdf) - PDF parser for AI data extraction — Extract Markdown, JSON (with bounding boxes), and HTML from any PDF.

##### OCR

- dots.ocr - 是一款強大的多語言文件解析器，能在單一視覺語言模型中整合版面檢測與內容識別功能，同時維持良好的閱讀順序。儘管其基礎模型僅採用精簡的 1.7B參數大型語言模型架構，仍能達到頂尖技術水準（SOTA）的表現。 
    - GitHub: [https://github.com/rednote-hilab/dots.ocr](https://github.com/rednote-hilab/dots.ocr)
    - YT: [https://www.youtube.com/watch?v=t\_8ZgUIgnLo](https://www.youtube.com/watch?v=t_8ZgUIgnLo)
    - [🚀重磅开源！本地部署1.7B参数超强OCR大模型dots.ocr！超越GPT-4o和olmOCR！结构化精准提取复杂PDF扫描件！完美识别中英文文档、模糊扫描件与复杂表格！文档解析准确率接近100%！ - AI超元域的博客](https://www.aivi.fyi/llms/introduce-dots.ocr)
- DeepSeek-OCR - 只有3B參數，採用「光學上下文壓縮」技術，將文字視為圖像，利用視覺token進行壓縮和理解，把長文字轉換成圖像進行處理，極大地降低了計算資源消耗。 
    - GitHub: [https://github.com/deepseek-ai/DeepSeek-OCR](https://github.com/deepseek-ai/DeepSeek-OCR)
    - GitHub: [https://github.com/deepseek-ai/DeepSeek-OCR-2](https://github.com/deepseek-ai/DeepSeek-OCR-2)
    - HF: [https://huggingface.co/deepseek-ai/DeepSeek-OCR](https://huggingface.co/deepseek-ai/DeepSeek-OCR)
    - HF: [https://huggingface.co/deepseek-ai/DeepSeek-OCR-2](https://huggingface.co/deepseek-ai/DeepSeek-OCR-2)
    - YT: [https://www.youtube.com/watch?v=9oICqbApvTg](https://www.youtube.com/watch?v=9oICqbApvTg)
    - [🚀DeepSeek又放大招！这个OCR模型让文档识别效率倍增！本地部署+客观实测DeepSeek-OCR！OCR识别准确率97%，支持100+语言，每天处理3300万页文档的开源大模型！ - AI超元域的博客](https://www.aivi.fyi/llms/deploy-DeepSeek-OCR)
- [OCRFlux](https://github.com/chatdoc-com/OCRFlux) is a multimodal large language model based toolkit for converting PDFs and images into clean, readable, plain Markdown text.
- [olmOCR](https://olmocr.allenai.org/) - 支持結構化精准提取復雜PDF文件內容！完美識別中英文文檔、模糊掃描件與復雜表格！本地部署與實際測試全過程！醫療法律行業必備！輕松應對企業級PDF批量轉換需求 
    - GH: [https://github.com/allenai/olmocr](https://github.com/allenai/olmocr)
    - Demo: [https://olmocr.allenai.org/](https://olmocr.allenai.org/)
    - [🚀本地部署最强OCR大模型olmOCR！支持结构化精准提取复杂PDF文件内容！完美识别中英文文档、模糊扫描件与复杂表格！本地部署与实际测试全过程！医疗法律行业必备！轻松应对企业级PDF批量转换需求！ - AI超元域的博客](https://www.aivi.fyi/llms/deploy-olmOCR)
    - YT: [https://www.youtube.com/watch?v=XF3Q\_ZjwfaI](https://www.youtube.com/watch?v=XF3Q_ZjwfaI)
- [Mistral OCR 3](https://mistral.ai/news/mistral-ocr-3) - 雲端商用服務，可提取 PDF/Image 格式文件，手寫中文辨識不佳；中文印刷字體辨識沒問題。
- [Paddle OCR](https://www.paddleocr.com/) - 百度的開源文件解析模型 PaddleOCR-VL-1.5 
    - GitHub: [https://github.com/PaddlePaddle/PaddleOCR](https://github.com/PaddlePaddle/PaddleOCR)
    - HF: [https://huggingface.co/spaces/PaddlePaddle/PaddleOCR-VL-1.5\_Online\_Demo](https://huggingface.co/spaces/PaddlePaddle/PaddleOCR-VL-1.5_Online_Demo)
- [Zerox OCR](https://github.com/getomni-ai/zerox) - 上傳檔案 ➜ 轉成圖片序列 ➜ 交給視覺模型分析 ➜ 輸出 Markdown ，支援 PDF/DOCX/Excel/PPT等格式，內建 JSON Schema 結構化輸出。
- [MinerU](https://github.com/opendatalab/MinerU) — High-accuracy document parsing engine for LLM · RAG · Agent workflows

#### More AI

##### aidocx

運用 AI 自動生成特定知識的技術書籍(\*.epub)

- [aidocx: 知識擷取小幫手 :: Learn with AI (learninfun.github.io)](https://learninfun.github.io/learn-with-ai/zh-tw/aidocx/)
- GitHub: [learninfun/aidocx: A tool to extract knowledge from AI (github.com)](https://github.com/learninfun/aidocx)

##### WrenAI - text-to-SQL

[WrenAI](https://www.getwren.ai/) is a text-to-SQL solution for data teams to get results and insights faster by asking business questions without writing SQL.

- GitHub: [https://github.com/Canner/WrenAI](https://github.com/Canner/WrenAI)

##### QAnything

開源的企業級本地知識庫問答及應用

- [QAnything](https://qanything.ai/)
- Doc: [https://qanything.ai/docs/introduce](https://qanything.ai/docs/introduce)
- GitHub: [https://github.com/netease-youdao/QAnything](https://github.com/netease-youdao/QAnything)

##### PageLM

PageLM 是由開源社區 CaviraOSS 發起并維護的一個社區驅動項目，它在設計理念上受到了 Google NotebookLM 的啓發，但走出了一條完全不同的路徑——開源、免費、多模型支持。

- GitHub: [https://github.com/CaviraOSS/PageLM](https://github.com/CaviraOSS/PageLM)

##### Vane (Perplexica)

平替 Perplexity 的自架方案

- GitHub: [https://github.com/ItzCrazyKns/Vane](https://github.com/ItzCrazyKns/Vane)

##### Open Notebook

平替 Google NotebookLM

- GitHub: [https://github.com/lfnovo/open-notebook](https://github.com/lfnovo/open-notebook)