23:25 · 2026年3月24日 · 周二 gpu and data is all you need —— 记一次 qwen3.5 的思维链微调via V2EX - 技术 (author: codingmiao) Telegraph gpu and data is all you need —— 记一次 qwen3.5 的思维链微调 qwen3.5 挺好用,输出质量高还支持多模态,但是思考过程经常会中英文混杂而且很冗长,一个很简单的问题哐哐输出一堆思考。 搜索了改 jinja 模板之类的解决方案无果,刷到了Jackrong/Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled 这个最近比较火的魔改版,换了跑起来确实思考精简了很多,但这玩意用的是 opus 的蒸馏数据来微调的,opus 那 summary 的思考过程,真的能被 9B 模型的智商理解么,作者也未给出测试结果。 以前我只是用自己的笔记本…