Content
@
0 reply
0 recast
0 reaction
Chiuu
@chiuu
Vì sao DeepSeek lại đang gây chấn động: 1. Trước tiên, một chút bối cảnh: Hiện nay, việc huấn luyện các mô hình AI hàng đầu CỰC KỲ tốn kém. OpenAI, Anthropic, v.v. chi hơn 100 triệu USD chỉ để tính toán. Họ cần các trung tâm dữ liệu khổng lồ với hàng ngàn GPU trị giá 40.000 USD mỗi chiếc. Giống như cần cả một nhà máy điện để vận hành một nhà máy sản xuất. 2. DeepSeek xuất hiện và nói: "LOL, nếu chúng tôi làm việc này với 5 triệu USD thì sao?" Và họ không chỉ nói - họ thực sự đã LÀM được. Các mô hình của họ sánh ngang hoặc vượt qua GPT-4 và Claude trong nhiều nhiệm vụ. Thế giới AI đang (như các bạn trẻ nói) "sốc toàn tập".
5 replies
0 recast
4 reactions
Chiuu
@chiuu
3. Làm thế nào? Họ đã suy nghĩ lại mọi thứ từ đầu. AI truyền thống giống như viết mọi con số với 32 chữ số thập phân. DeepSeek thì nói: "nếu chỉ dùng 8 chữ số thì sao? Vẫn đủ chính xác đấy!" Boom - giảm 75% bộ nhớ cần thiết. 4. Tiếp đó là hệ thống "đa token" của họ. AI thông thường đọc như học sinh lớp một: "Con... mèo... ngồi..." DeepSeek đọc cả cụm từ cùng lúc. Nhanh gấp đôi, chính xác 90%. Khi bạn xử lý hàng tỷ từ, điều này rất QUAN TRỌNG.
0 reply
0 recast
0 reaction