Content
@
0 reply
0 recast
0 reaction
Chiuu
@chiuu
Vì sao DeepSeek lại đang gây chấn động: 1. Trước tiên, một chút bối cảnh: Hiện nay, việc huấn luyện các mô hình AI hàng đầu CỰC KỲ tốn kém. OpenAI, Anthropic, v.v. chi hơn 100 triệu USD chỉ để tính toán. Họ cần các trung tâm dữ liệu khổng lồ với hàng ngàn GPU trị giá 40.000 USD mỗi chiếc. Giống như cần cả một nhà máy điện để vận hành một nhà máy sản xuất. 2. DeepSeek xuất hiện và nói: "LOL, nếu chúng tôi làm việc này với 5 triệu USD thì sao?" Và họ không chỉ nói - họ thực sự đã LÀM được. Các mô hình của họ sánh ngang hoặc vượt qua GPT-4 và Claude trong nhiều nhiệm vụ. Thế giới AI đang (như các bạn trẻ nói) "sốc toàn tập".
5 replies
0 recast
4 reactions
Chiuu
@chiuu
11. Và đây là điểm thú vị: DeepSeek đã làm điều này với đội ngũ dưới 200 người. Trong khi đó, Meta có những đội ngũ với chi phí trả lương thôi cũng vượt ngân sách huấn luyện toàn bộ của DeepSeek... mà các mô hình của họ vẫn không tốt bằng. 12. Đây là câu chuyện kinh điển về sự phá vỡ: Các công ty lâu đời tối ưu hóa quy trình hiện có, còn các công ty phá vỡ suy nghĩ lại cách tiếp cận từ gốc. DeepSeek hỏi: "Nếu chúng ta làm thông minh hơn thay vì ném thêm phần cứng vào thì sao?" 13. Ý nghĩa rất lớn: Phát triển AI trở nên dễ tiếp cận hơn Cạnh tranh tăng lên đáng kể "Hào" bảo vệ của các công ty lớn trông giống như những vũng nước nhỏ Yêu cầu phần cứng (và chi phí) giảm mạnh
0 reply
0 recast
0 reaction