玩酷网
蚁工厂的文章
deepseek提出的GRPO算法效果很好不过存在一些训练不稳定性的问题。 中科
2025-08-02 19:50
deepseek提出的GRPO算法效果很好不过存在一些训练不稳定性的问题。 中科
Ivan Fioravanti 对Qwen3-Coder的量化版本测试结果如图结
2025-08-02 10:50
Ivan Fioravanti 对Qwen3-Coder的量化版本测试结果如图结
师傅你是做什么工作的
2025-08-02 09:50
师傅你是做什么工作的
汽车置换补贴将恢复发放河北汽车置换补贴抢券上线秒没事实再次证明,大家现在换车、买
2025-08-01 21:50
汽车置换补贴将恢复发放河北汽车置换补贴抢券上线秒没事实再次证明,大家现在换车、买
分享图片
2025-08-01 21:04
分享图片
Github上的一份不断更新的Linux服务器加固指南github.com/im
2025-08-01 19:50
Github上的一份不断更新的Linux服务器加固指南github.com/im
网传的openai开源模型信息
2025-08-01 19:50
网传的openai开源模型信息
Kimi的API刚出了一个高速版。和原版本参数一致但输出速度由每秒 10 Tok
2025-08-01 14:50
Kimi的API刚出了一个高速版。和原版本参数一致但输出速度由每秒 10 Tok
React学习资源库github.com/knowledgefxg/react-
2025-08-01 10:50
React学习资源库github.com/knowledgefxg/react-
跃进星辰的Step3已开源(多模态, MoE 架构,总参数量321B,激活参数量
2025-08-01 10:50
跃进星辰的Step3已开源(多模态, MoE 架构,总参数量321B,激活参数量
英伟达被约谈
2025-07-31 13:49
英伟达被约谈
一张图看 Redis 的两种核心持久化机制:RDB(Redis Database
2025-07-31 13:50
一张图看 Redis 的两种核心持久化机制:RDB(Redis Database
分享图片
2025-07-31 13:49
分享图片
没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型
2025-07-31 09:49
没有GPU也可以相对较快的跑本地大模型了。上海交大搞了一个专为本地运行的系列模型
分享图片
2025-07-31 08:49
分享图片
今天发了Qwen3-30B-A3B的推理版本,明天还可能会发对应的coder版~
2025-07-31 00:49
今天发了Qwen3-30B-A3B的推理版本,明天还可能会发对应的coder版~
系统设计的“元素周期表”github.com/jarulraj/periodic
2025-07-30 20:51
系统设计的“元素周期表”github.com/jarulraj/periodic
的冰箱贴[太开心]
2025-07-30 16:49
的冰箱贴[太开心]
在网上查看其他博主实测,被 GLM-4.5 惊艳到!GLM-4.5 的三个测试藏
2025-07-30 15:54
在网上查看其他博主实测,被 GLM-4.5 惊艳到!GLM-4.5 的三个测试藏
快手和人大提出了ARPO算法,一种专为训练多轮基于大语言模型的智能体制定的强化学
2025-07-30 09:51
快手和人大提出了ARPO算法,一种专为训练多轮基于大语言模型的智能体制定的强化学
第一页
下一页
作者信息
蚁工厂
感谢大家的关注
分类: 科技
热门分类
推荐
热榜
军事
NBA
体育
社会
明星八卦
娱乐
财经
科技
汽车
历史
国际
游戏
动漫
公益
搞笑
商业
互联网
数码
国际足球
房产
家居
时尚
科学探索
职场
育儿
股票
教育
影视
情感
热点
中国军情
武器
中国南海
中国足球
亚洲杯
科比
综合体育
CBA
投资
楼市
大咖秀
外汇
创业
风口
SUV
豪车
概念车
优惠
新能源
美国
欧洲
朝日韩
俄罗斯
孕期
街拍
恋爱攻略
婚姻
正能量