AI Applications
Chat AI
Cherry Studio
Cherry Studio is a desktop client that supports for multiple LLM providers, available on Windows, Mac and Linux.
- Support for Multiple LLM Providers.
- Allows creation of multiple Assistants.
- Enables creation of multiple topics.
- Allows using multiple models to answer questions in the same conversation.
- Supports drag-and-drop sorting.
- Code highlighting.
- Mermaid chart
Chatbox
Chatbox支援多款全球最先進的AI大模型服務,支援Windows、Mac和Linux。AI提升工作效率,深受全世界專業人士的好評。
- 取代難用的 ChatGPT 或其他網頁聊天介面。
- 可自訂多個不同 AI 助手。
- 操作介面簡潔又實用。
- 跨平台支援(Linux/Windows/Mac)
- 支援 OpenAI/Gemini/Ollama/Groq 等模型 API
- 支援繁中等多國語言
KHOJ
Your AI second brain
Paper AI
Elicit - 論文分析
- 雲端服務,免安裝,零元基本方案
- 可用中文分析、檢索、比對及總結多個論文。
- Elicit: The AI Research Assistant
- YT: 生成式AI應用課程(I)-如何以超人的速度來進行學術期刊論文研究 - YouTube
asXiv
- 用 Gemini AI 總結 arXiv.org 的論文
- Demo: https://asxiv.org/
- GitHub: https://github.com/montanaflynn/asxiv
GPT Academic
为GPT/GLM等LLM大语言模型提供实用化交互接口,特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, moss等。
Presentation AI
- Infography App - 5 秒鐘從文字到精美圖形,這款神器堪稱 PPT 殺手
PDF Extractor
- gptpdf - 使用 OpenAI API 提取 PDF 內容,輸出為 Markdown 格式。
- omniparse - PDF to Markdown
- PDF-Extract-Kit - Layout Detection, Formula Detection, Formula Recognition
- Marker - Marker converts PDF to markdown quickly and accurately.
- Mathpix (cloud)
- tabled - 提取表格內容
- MarkItDown - Microsoft 開發的各種類型檔案轉換成 Markdown 格式,支援指令與 Python API 兩種方式
- MinerU - 一站式開源高品質資料提取工具,將PDF轉換成Markdown和JSON格式。
- OpenDataLoader PDF - PDF parser for AI data extraction — Extract Markdown, JSON (with bounding boxes), and HTML from any PDF.
OCR
- dots.ocr - 是一款強大的多語言文件解析器,能在單一視覺語言模型中整合版面檢測與內容識別功能,同時維持良好的閱讀順序。儘管其基礎模型僅採用精簡的 1.7B參數大型語言模型架構,仍能達到頂尖技術水準(SOTA)的表現。
- DeepSeek-OCR - 只有3B參數,採用「光學上下文壓縮」技術,將文字視為圖像,利用視覺token進行壓縮和理解,把長文字轉換成圖像進行處理,極大地降低了計算資源消耗。
- GitHub: https://github.com/deepseek-ai/DeepSeek-OCR
- GitHub: https://github.com/deepseek-ai/DeepSeek-OCR-2
- HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR
- HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR-2
- YT: https://www.youtube.com/watch?v=9oICqbApvTg
- 🚀DeepSeek又放大招!这个OCR模型让文档识别效率倍增!本地部署+客观实测DeepSeek-OCR!OCR识别准确率97%,支持100+语言,每天处理3300万页文档的开源大模型! - AI超元域的博客
- OCRFlux is a multimodal large language model based toolkit for converting PDFs and images into clean, readable, plain Markdown text.
- olmOCR - 支持結構化精准提取復雜PDF文件內容!完美識別中英文文檔、模糊掃描件與復雜表格!本地部署與實際測試全過程!醫療法律行業必備!輕松應對企業級PDF批量轉換需求
- Mistral OCR 3 - 雲端商用服務,可提取 PDF/Image 格式文件,手寫中文辨識不佳;中文印刷字體辨識沒問題。
- Paddle OCR - 百度的開源文件解析模型 PaddleOCR-VL-1.5
- Zerox OCR - 上傳檔案 ➜ 轉成圖片序列 ➜ 交給視覺模型分析 ➜ 輸出 Markdown ,支援 PDF/DOCX/Excel/PPT等格式,內建 JSON Schema 結構化輸出。
More AI
aidocx
運用 AI 自動生成特定知識的技術書籍(*.epub)
- aidocx: 知識擷取小幫手 :: Learn with AI (learninfun.github.io)
- GitHub: learninfun/aidocx: A tool to extract knowledge from AI (github.com)
WrenAI - text-to-SQL
WrenAI is a text-to-SQL solution for data teams to get results and insights faster by asking business questions without writing SQL.
- GitHub: https://github.com/Canner/WrenAI
QAnything
開源的企業級本地知識庫問答及應用
- QAnything
- Doc: https://qanything.ai/docs/introduce
- GitHub: https://github.com/netease-youdao/QAnything
PageLM
PageLM 是由開源社區 CaviraOSS 發起并維護的一個社區驅動項目,它在設計理念上受到了 Google NotebookLM 的啓發,但走出了一條完全不同的路徑——開源、免費、多模型支持。
Vane (Perplexica)
平替 Perplexity 的自架方案