(评论)
(comments)
原始链接: https://news.ycombinator.com/item?id=43943047
Hacker News正在讨论llama.cpp(一个运行大型语言模型的框架)中新的视觉能力。用户dust42报告说,在M1 Mac上使用Gemma模型获得了令人印象深刻的性能。Danielhanchen重点介绍了优化的“unsloth”量化方法,以实现更快的视觉处理,并提供了命令行指令。用户现在可以直接使用`llama-mtmd-cli`工具。Banana_giraffe分享了一个使用Gemma3 4b为照片生成关键词和描述的项目,并将结果存储在SQLite数据库中。讨论涉及与Ollama相比的优化以及llama.cpp与ggml生态系统集成的优势。ngxson指出,llama.cpp现在支持SmolVLM系列,用于快速视频分析。Simonw提供了在macOS上运行新的视觉功能的详细信息,包括使用交互式终端或Web服务器。对话涵盖了GPU卸载和`convert_hf_to_gguf.py`工具的改进。几位用户表达了对更快、本地视觉处理的潜在影响的兴奋之情。
Steps to reproduce:
Then open http://127.0.0.1:8080/ for the web interfaceNote: if you are not using -hf, you must include the --mmproj switch or otherwise the web interface gives an error message that multimodal is not supported by the model.
I have used the official ggml-org/gemma-3-4b-it-GGUF quants, I expect the unsloth quants from danielhanchen to be a bit faster.
reply