linda fa pfp
linda fa
@linda0
DeepSeek 通过稀疏训练(Sparse Training)减少 50% 算力消耗,动态模型剪枝实现消费级 GPU 训练百亿参数模型。 市场对于短期内高端 GPU 的需求预期大幅下调,边缘计算的市场潜力被重新估值。如上图所示,DeepSeek 出现之前,行业内的巨大多数协议和应用都使用 AWS 等平台,只有极少数用例部署在去中心化 GPU 网络中,这类用例看中后者在消费级算力上的价格优势,并且不关注延迟的影响。
0 reply
0 recast
0 reaction