LLM Models
Resources
Chinese LLMs
- Taiwan LLM - Project TAME (TAiwanese Mixture of Experts)
- TAIDE (台德)- Trustworthy AI Dialogue Engine
- 01.AI - Yi
- CKIP-Llama-2-7b 是中央研究院詞庫小組(CKIP)開發的開源可商用繁體中文大型語言模型,以商用開源模型Llama-2-7b以及Atom-7b為基礎,再補強繁體中文的處理能力,並對405個可商用的任務檔案同步進行訓練優化,參數量達70億(7 billion)。
- Qwen - 阿里雲通義千問
- GLM-4 - 智譜 AI 推出的中文多語言模型
- Chinese-Mixtral
- DeepSeek - 深度求索
Code LLMs
- Granite - Open sourcing IBM’s Granite code models
- Codestral - Mistral's first generative AI model for code
- Gemini Code Assist - Google 推出的程式編寫助理,可以在 VS Code、JetBrains IDE 上使用。
Evaluation/Monitor
- PromptBench: A Unified Library for Evaluating and Understanding Large Language Models.
- AI產品與系統評測中心: AI評測模擬測試題庫.xlsx
- Opik is an open-source platform for evaluating, testing and monitoring LLM applications.
Function Calling LLMs
Content Safty
- Google ShieldGemma
ShieldGemma則是個安全分類模型,可額外部署在模型的輸入及輸出端,用以過濾有害內容,它主要篩選4大領域的內容,包括仇恨言論、騷擾、裸露的色情內容,以及危險內容。
Hardware Requirements
- 如何計算 Model 需要多少 GPU VRAM
- Calculates how much GPU memory you need and how much token/s you can get for any LLM & GPU/CPU
- LLM RAM Calculator
- llmfit - A terminal tool that right-sizes LLM models to your system's RAM, CPU, and GPU.
- CanIRun.ai