17
2025-06
qwen3-0.6B这种小模型有什么实际意义和用途吗?
0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务...
查看详细...
17
2025-06
如何评价Google刚刚发布的 Gemini Diffusion? 会代替自回归模型成为下一代模型吗?
首先谷歌的 llm diffusion 和之前发布的 llm...
查看详细...
17
2025-06
大量消息在 MQ 里长时间积压,该如何解决?
一个同学跟我说,昨天他去字节跳动面试,面试官这样问他,“如何...
查看详细...
18
2025-06
为什么女游泳运动员看起来大部分都是平胸?
(最新补充20250614) 她们只是看着胸部较平,你不会是...
查看详细...