玩酷网

蚁工厂的文章

deepseek提出的GRPO算法效果很好不过存在一些训练不稳定性的问题。 中科

deepseek提出的GRPO算法效果很好不过存在一些训练不稳定性的问题。 中科

deepseek提出的GRPO算法效果很好不过存在一些训练不稳定性的问题。 中科
Ivan Fioravanti 对Qwen3-Coder的量化版本测试结果如图结

Ivan Fioravanti 对Qwen3-Coder的量化版本测试结果如图结

Ivan Fioravanti 对Qwen3-Coder的量化版本测试结果如图结
师傅你是做什么工作的 ​​​

师傅你是做什么工作的 ​​​

师傅你是做什么工作的 ​​​
汽车置换补贴将恢复发放河北汽车置换补贴抢券上线秒没事实再次证明,大家现在换车、买

汽车置换补贴将恢复发放河北汽车置换补贴抢券上线秒没事实再次证明,大家现在换车、买

汽车置换补贴将恢复发放河北汽车置换补贴抢券上线秒没事实再次证明,大家现在换车、买
分享图片 ​​​

分享图片 ​​​

分享图片 ​​​
Github上的一份不断更新的Linux服务器加固指南github.com/im

Github上的一份不断更新的Linux服务器加固指南github.com/im

Github上的一份不断更新的Linux服务器加固指南github.com/im
网传的openai开源模型信息 ​​​

网传的openai开源模型信息 ​​​

网传的openai开源模型信息 ​​​
Kimi的API刚出了一个高速版。和原版本参数一致但输出速度由每秒 10 Tok

Kimi的API刚出了一个高速版。和原版本参数一致但输出速度由每秒 10 Tok

Kimi的API刚出了一个高速版。和原版本参数一致但输出速度由每秒 10 Tok
React学习资源库github.com/knowledgefxg/react-

React学习资源库github.com/knowledgefxg/react-

React学习资源库github.com/knowledgefxg/react-

跃进星辰的Step3已开源(多模态, MoE 架构,总参数量321B,激活参数量

跃进星辰的Step3已开源(多模态, MoE 架构,总参数量321B,激活参数量
英伟达被约谈 ​​​

英伟达被约谈 ​​​

英伟达被约谈 ​​​
一张图看 Redis 的两种核心持久化机制:RDB(Redis Database

一张图看 Redis 的两种核心持久化机制:RDB(Redis Database

一张图看 Redis 的两种核心持久化机制:RDB(Redis Database
分享图片 ​​​

分享图片 ​​​

分享图片 ​​​
没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型

没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型

没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型
分享图片 ​​​

分享图片 ​​​

分享图片 ​​​
今天发了Qwen3-30B-A3B的推理版本,明天还可能会发对应的coder版~

今天发了Qwen3-30B-A3B的推理版本,明天还可能会发对应的coder版~

今天发了Qwen3-30B-A3B的推理版本,明天还可能会发对应的coder版~
系统设计的“元素周期表”github.com/jarulraj/periodic

系统设计的“元素周期表”github.com/jarulraj/periodic

系统设计的“元素周期表”github.com/jarulraj/periodic
的冰箱贴[太开心] ​​​

的冰箱贴[太开心] ​​​

的冰箱贴[太开心] ​​​
在网上查看其他博主实测,被 GLM-4.5 惊艳到!GLM-4.5 的三个测试藏

在网上查看其他博主实测,被 GLM-4.5 惊艳到!GLM-4.5 的三个测试藏

在网上查看其他博主实测,被 GLM-4.5 惊艳到!GLM-4.5 的三个测试藏
快手和人大提出了ARPO算法,一种专为训练多轮基于大语言模型的智能体制定的强化学

快手和人大提出了ARPO算法,一种专为训练多轮基于大语言模型的智能体制定的强化学

快手和人大提出了ARPO算法,一种专为训练多轮基于大语言模型的智能体制定的强化学