Content pfp
Content
@
0 reply
0 recast
0 reaction

Chiuu pfp
Chiuu
@chiuu
Vì sao DeepSeek lại đang gây chấn động: 1. Trước tiên, một chút bối cảnh: Hiện nay, việc huấn luyện các mô hình AI hàng đầu CỰC KỲ tốn kém. OpenAI, Anthropic, v.v. chi hơn 100 triệu USD chỉ để tính toán. Họ cần các trung tâm dữ liệu khổng lồ với hàng ngàn GPU trị giá 40.000 USD mỗi chiếc. Giống như cần cả một nhà máy điện để vận hành một nhà máy sản xuất. 2. DeepSeek xuất hiện và nói: "LOL, nếu chúng tôi làm việc này với 5 triệu USD thì sao?" Và họ không chỉ nói - họ thực sự đã LÀM được. Các mô hình của họ sánh ngang hoặc vượt qua GPT-4 và Claude trong nhiều nhiệm vụ. Thế giới AI đang (như các bạn trẻ nói) "sốc toàn tập".
5 replies
0 recast
4 reactions

Chiuu pfp
Chiuu
@chiuu
5. Nhưng đây mới là phần thông minh nhất: Họ xây dựng một "hệ thống chuyên gia". Thay vì một AI khổng lồ cố gắng biết mọi thứ (giống như bắt một người vừa làm bác sĩ, luật sư, vừa làm kỹ sư), họ có các chuyên gia chuyên biệt chỉ hoạt động khi cần. 6. Các mô hình truyền thống? Tất cả 1,8 nghìn tỷ tham số luôn hoạt động. DeepSeek? Tổng cộng 671 tỷ, nhưng chỉ 37 tỷ hoạt động cùng lúc. Giống như có một đội lớn nhưng chỉ gọi đúng chuyên gia cần thiết cho từng nhiệm vụ. 7. Kết quả rất đáng kinh ngạc: Chi phí huấn luyện: 100 triệu USD → 5 triệu USD GPU cần thiết: 100.000 → 2.000 Chi phí API: giảm 95% Có thể chạy trên GPU chơi game thay vì phần cứng trung tâm dữ liệu
0 reply
0 recast
0 reaction