MLX-VLM
AI工具Mac本地视觉语言模型推理和微调工具包,基于Apple MLX框架
💰 开源📱 mac, cli, api👁 1 次浏览🔗 0 次点击📅 2026/4/5 收录
📖 详细介绍
MLX-VLM 是专为 Apple Silicon Mac 设计的视觉语言模型(VLM)推理和微调工具包,基于 Apple 的 MLX 框架构建。支持图像、音频和视频的多模态推理,兼容数十种预训练模型(如 LLaVA、Qwen2-VL、Gemma3 等)。提供命令行、Gradio 聊天 UI 和 Python API 三种使用方式。无需 GPU 服务器,在 Mac 上就能本地运行视觉大模型进行图片理解、OCR、视频分析等任务。GitHub 增长迅猛,在 Trending 日榜获得 343 Star 单日增长。
✅ 核心功能
- ✓Apple Silicon优化
- ✓多模态推理
- ✓模型微调
- ✓数十种VLM支持
- ✓Gradio UI
- ✓本地运行