AI 技术 · 实践记录

自动化部署、AI 工具、内容系统—— 2 篇文章

场景复现在本地部署高性能 Qwen3.5 模型时，开发者常因 Ollama 模板配置不当，无法正确控制模型的“Thinking”（思维链）模式。这导致模型输出冗余推理过程，或在需要推理时反而静默，严重阻碍了开发效率与业务场景落地。核心

[Ollama Qwen3.5] 调整 Modelfile 模板配置解决 thinking 模式无法禁用的难题

场景复现在本地部署 Qwen3.5 大模型（如 Unsloth GGUF 版本）时，许多开发者发现无法有效关闭模型的“thinking”思考模式。这导致输出包含冗长的推理过程，不仅拖慢了响应速度，还增加了 Token 消耗。现有的文档对于