
Thế hệ mô hình ngôn ngữ mới từ DeepSeek, một công ty khởi nghiệp Trung Quốc có trụ sở tại Hàng Châu, đã trở thành một trong những phát triển được bàn luận nhiều nhất trong lĩnh vực trí tuệ nhân tạo. Loạt sản phẩm của họ DeepSeek V4 bùng phát trong Trong thời điểm bão hòa các lời chào mời và hứa hẹn, nhưng với một thông điệp rất rõ ràng: cung cấp các khả năng hàng đầu về suy luận và tác nhân, với cửa sổ ngữ cảnh khổng lồ và trên hết, với chi phí sử dụng thấp hơn nhiều so với các đối thủ đến từ Mỹ.
Sự kiện ra mắt này không phải là một sự kiện đơn lẻ. Nó diễn ra chỉ vài ngày sau đó. phiên bản mới của ChatGPT và các mô hình khép kín khácTrong bối cảnh Trung Quốc đang nỗ lực giảm sự phụ thuộc công nghệ vào phương Tây, DeepSeek V4 kết hợp... chiến lược nguồn mởChiến lược định giá cạnh tranh và liên minh chặt chẽ với Huawei trong lĩnh vực phần cứng có thể làm thay đổi cán cân quyền lực đối với các công ty châu Âu đang tìm kiếm những lựa chọn thay thế rẻ hơn và dễ kiểm soát hơn.
DeepSeek V4 là gì và nó được xây dựng như thế nào?
Dòng sản phẩm DeepSeek V4 bao gồm: Mô hình ngôn ngữ hỗn hợp chuyên gia (MoE) Được thiết kế để đạt hiệu quả cao trong bối cảnh dài hạn. Công ty đề cập đến một mô hình chính với khoảng Tổng cộng 1 nghìn tỷ tham sốtrong đó chỉ một phần nhỏ được kích hoạt trong mỗi token, và một phiên bản tham vọng hơn nữa, V4-Pro, đạt đến mức độ... 1,6 nghìn tỷ tham sốvới khoảng 49.000 tỷ tài sản cho mỗi truy vấn.
Điểm mấu chốt trong phương pháp MoE của DeepSeek là, mặc dù tổng số tham số rất lớn, nhưng chỉ có hàng chục tỷ tham số được kích hoạt ở mỗi bước suy luận. Điều này cho phép giảm đáng kể chi phí tính toán và bộ nhớ. so với các mô hình đặc có kích thước tương tự. Một số tài liệu kỹ thuật đề cập đến khoảng 37.000 tỷ tham số hoạt động trên mỗi token Trong một trong những biến thể, điều này phù hợp với ý tưởng về hiệu quả cực cao mà không làm giảm hiệu năng.
Hai phiên bản: V4-Pro và V4-Flash dành cho các nhu cầu khác nhau.
DeepSeek đã phân chia sản phẩm của mình thành hai mô hình chính: V4-Pro và V4-FlashV4-Pro là mẫu flagship, với 1,6 nghìn tỷ tham số đã đề cập ở trên và tập trung vào... khả năng suy luận sâu sắc, kiến thức toàn cầu và năng lực tác chiếnđặc biệt là trong lập trình và các nhiệm vụ phân tích phức tạp.
Về phần mình, V4-Flash được giới thiệu là phiên bản nhẹ và nhanh.Nó có khoảng 284.000 tỷ tham số tổng cộng và khoảng 13.000 tỷ tham số hoạt động, đồng thời duy trì một cửa sổ ngữ cảnh của tối đa một triệu tokenNó được thiết kế cho các triển khai quy mô lớn, nơi chi phí trên mỗi token, độ trễ và khả năng mở rộng quan trọng hơn việc tối ưu hóa từng phần mười điểm số hiệu năng.
Sự kết hợp giữa Pro/Flash này mang lại nhiều hơn thế nữa. chiến lược thương mại vượt xa sự khác biệt kỹ thuật đơn thuầnV4-Pro hướng đến các tập đoàn lớn, phòng thí nghiệm và các trường hợp sử dụng đòi hỏi hiệu năng cao nhất; trong khi đó, V4-Flash hướng đến vai trò "công cụ đắc lực" cho các doanh nghiệp vừa và nhỏ, các công ty khởi nghiệp và các dịch vụ có khối lượng giao dịch lớn cần trí tuệ nhân tạo hiệu quả và giá cả phải chăng.
Bối cảnh của một triệu token: điều gì thay đổi trong việc sử dụng thực tế?
Một trong những tính năng nổi bật nhất của DeepSeek V4 là khả năng của nó. cửa sổ ngữ cảnh cực dài lên đến một triệu tokenCon số này cao hơn nhiều so với 128.000 token thường thấy trong nhiều mô hình kinh doanh hiện nay. Trên thực tế, điều này tương đương với việc có thể làm việc với... hàng trăm nghìn từ trong một truy vấn duy nhất: Lưu trữ đầy đủ các tài liệu kỹ thuật, kho mã nguồn lớn, hồ sơ dịch vụ khách hàng pháp lý hoặc lịch sử mà không cần phải phân mảnh chúng.
Ngoài hình ảnh cụ thể, bối cảnh rộng lớn này có thể... giảm chi phí và sai sót phát sinh do việc chia nhỏ tài liệu.Số lượng cuộc gọi API cần thiết ít hơn, nguy cơ mất thông tin giữa các lần quét giảm đi, và việc thiết kế các sản phẩm dựa trên khối lượng lớn văn bản được đơn giản hóa đáng kể. DeepSeek trình bày mô hình không chỉ đơn thuần là một chatbot, mà còn là một... trợ lý dự án hoặc một người đại diện có khả năng lập kế hoạch và sắp xếp trình tự các nhiệm vụ. trên các tập dữ liệu lớn.
Tại châu Âu và Tây Ban Nha, bối cảnh này đặc biệt thú vị đối với các lĩnh vực như... pháp lý, tài chính, tư vấn, hành chính công hoặc chăm sóc sức khỏeTrong đó việc xử lý tài liệu rất đồ sộ là điều phổ biến. Thách thức sẽ là xác minh xem mô hình có duy trì được khả năng đó hay không. độ trễ hợp lý và chi phí thực sự cạnh tranh trên mỗi triệu token. trong môi trường sản xuất.
Khả năng suy luận và các tác nhân: canh bạc để cạnh tranh với các hệ thống khép kín
DeepSeek khẳng định rằng V4-Pro Nó vượt trội hơn hầu hết các mẫu xe mui trần hiện nay. Trong các bài kiểm tra kiến thức và khả năng suy luận toàn cầu, nó chỉ hơi kém hơn một số mô hình mã nguồn đóng tốt nhất, chẳng hạn như các phiên bản mới nhất của Gemini. Về khả năng suy luận nâng cao, công ty tuyên bố đạt hiệu quả tương đương với các giải pháp cao cấp từ OpenAI và Anthropic.
Trong lĩnh vực các tác nhân và nhiệm vụ liên kếtDeepSeek V4 được thiết kế để hoạt động không chỉ như một trình tạo văn bản đơn thuần. Công ty hiện đang sử dụng V4-Pro nội bộ cho nhiều mục đích khác. Lập trình có sự hỗ trợ của máy tính, tự động hóa quy trình làm việc và phân tích phức tạpVới ý tưởng rằng mô hình có thể lập kế hoạch, thực hiện và kiểm chứng các nhiệm vụ phụ một cách tương đối tự chủ.
Dành cho các công ty Tây Ban Nha hoạt động trong lĩnh vực tự động hóa quy trình, phát triển phần mềm hoặc bộ phận hỗ trợ xử lý dữ liệu chuyên sâuSự kết hợp giữa khả năng lập luận mạnh mẽ, bối cảnh rộng lớn và chi phí thấp có thể rất hấp dẫn. Tuy nhiên, mức độ trưởng thành thực tế của các tác nhân V4 và... sự mạnh mẽ trong tiếng Tây Ban Nha Đây vẫn là những khía cạnh cần được đánh giá trong các thử nghiệm độc lập.
Mô hình mã nguồn mở so với mô hình mã nguồn đóng: tác động đối với châu Âu
Dòng V4 được giới thiệu như sau: mô hình mở với quyền truy cập sớmDeepSeek đã phát hành phiên bản V4-Pro và V4-Flash trên các nền tảng như Hugging Face ở chế độ xem trước, cho phép thử nghiệm cả trong chính ứng dụng trò chuyện của họ và thông qua API. Một số biến thể đề cập đến... Giấy phép kiểu MIT Điều này sẽ mở ra cơ hội cho việc tải xuống và triển khai cục bộ mà không gặp phải những hạn chế thường thấy của nhiều mô hình kinh doanh.
Cách tiếp cận này trực tiếp đối đầu với chiến lược của các mô hình Thung lũng Silicon khép kínVà với những cuộc tranh luận đang diễn ra về cách đóng mã nguồn mở, nơi quyền truy cập thường gắn liền với các hợp đồng API, các nhà cung cấp dịch vụ đám mây cụ thể và giá cả cao hơn, nếu DeepSeek V4 xác nhận rằng khoảng cách hiệu năng giữa mã nguồn mở và mã nguồn đóng đã thu hẹp xuống gần như bằng không, nhiều công ty châu Âu có thể xem xét lại sự phụ thuộc của họ vào các nhà cung cấp của Mỹ.
Trong bối cảnh pháp lý của EU, được đánh dấu bởi Đạo luật về trí tuệ nhân tạo và các yêu cầu nghiêm ngặt liên quan đến chủ quyền dữ liệuViệc sở hữu các mô hình mạnh mẽ có thể chạy tại chỗ hoặc trên các đám mây châu Âu mà không mất quyền kiểm soát thông tin trở thành một yếu tố then chốt. Tuy nhiên, mã nguồn mở của Trung Quốc cũng đặt ra những câu hỏi về chính trị và lòng tin mà các chính phủ và các tập đoàn lớn cần phải cân nhắc kỹ lưỡng.
Liên minh với Huawei và phần cứng thay thế cho NVIDIA.
Một trong những yếu tố nhạy cảm nhất của DeepSeek V4 là... thay đổi trong cơ sở phần cứngSau những tranh cãi về việc sử dụng GPU NVIDIA H800 và thậm chí cả những cáo buộc về việc sử dụng chip Blackwell bị cấm, công ty này đã tăng cường quan hệ với Huawei để giảm thiểu rủi ro bị ảnh hưởng bởi các lệnh trừng phạt của Mỹ.
Ngay sau khi công bố V4, Huawei chính thức tuyên bố sẽ cung cấp sản phẩm của mình. Các chip Ascend và hệ thống siêu nút Để thực hiện các tác vụ suy luận của DeepSeek, trong đó, các bộ tăng tốc nổi bật hơn cả. Atlas 350 được trang bị bộ xử lý Ascend 950PR.Những phần mềm này đã được tối ưu hóa đặc biệt cho loại mô hình MoE này và hiện đang được bán như một giải pháp thay thế nội địa cho cơ sở hạ tầng dựa trên NVIDIA.
Tài liệu kỹ thuật V4 đề cập đến quá trình phát triển của Các nhân hệ điều hành được điều chỉnh cho cả phần cứng Huawei và GPU NVIDIA.Khả năng tương thích kép này sẽ cho phép công ty vượt qua các lệnh cấm vận tiềm tàng từ phương Tây đồng thời tận dụng được sức mạnh của hệ sinh thái chip Trung Quốc. Đối với châu Âu, động thái này mở ra cánh cửa cho một giải pháp AI mạnh mẽ không hoàn toàn phụ thuộc vào chuỗi cung ứng Bắc Mỹ, mặc dù việc sử dụng phần cứng từ Trung Quốc cũng sẽ bị xem xét kỹ lưỡng từ góc độ… an ninh mạng và sự phụ thuộc chiến lược.
Chiến lược định giá: chi phí phát sinh trên mỗi triệu token
DeepSeek từ lâu đã định vị mình là... lựa chọn "lý luận đơn giản"Hãng đã làm điều đó với mô hình R1 và giờ đây củng cố cam kết đó với V4. Theo ước tính của chính công ty và các nhà cung cấp API đang thử nghiệm mô hình, chi phí suy luận có thể vào khoảng... 0,30 đô la cho một triệu mã thông báoMức giá này thấp hơn nhiều so với mức phí mà nhiều dịch vụ cao cấp ở phương Tây tính.
Hơn nữa, DeepSeek khẳng định rằng, đối với phiên bản Flash, Nó sẽ duy trì mức giá tương tự như mẫu V2. Ra mắt vào năm 2024, và thậm chí còn ám chỉ rằng giá cả có thể... giảm mạnh hơn nữa trong nửa cuối năm 2026...khi các siêu nút Ascend 950PR của Huawei được triển khai trên quy mô lớn. Thông báo này đã có tác động ngay lập tức đến... Thị trường chứng khoán Trung Quốc đang thúc đẩy các công ty bán dẫn trong nước..
Trên thực tế, đối với một công ty Tây Ban Nha xử lý các tài liệu pháp lý dài, lịch sử tài chính hoặc khối lượng lớn các tương tác với khách hàng, cấu trúc giá này cho phép họ hoạt động với tỷ suất lợi nhuận cao hơn nhiều so với những kết quả thu được bằng các API đắt tiền hơn. Tuy nhiên, vẫn còn phải xem liệu các mức giá này có được duy trì sau khi V4 thoát khỏi chế độ xem trước hay không và liệu một số khoản tiết kiệm có bị bù đắp bởi những yếu tố khác hay không. sự phức tạp triển khai lớn hơn so với các dịch vụ đã phát triển hơn.
Tính khả dụng, tình trạng phát triển và khả năng truy cập từ châu Âu
Theo chính công ty, DeepSeek V4 đang trong giai đoạn... Chế độ "xem trước" hoặc truy cập sớmPhiên bản V4-Pro và phiên bản nhẹ hơn của nó hiện đã có thể được thử nghiệm thông qua kênh trò chuyện chính thức của DeepSeek và qua API, trong khi một số nhà cung cấp bên thứ ba, chẳng hạn như... các nền tảng của bên thứ ba cung cấp các nút thử nghiệmHọ đã bắt đầu cấp quyền truy cập hạn chế cho các nhà phát triển.
Lộ trình phát triển của công ty đã gặp phải một số trở ngại nhất định. sự chậm trễ so với ngày tháng bị rò rỉ ban đầuĐiều này cho thấy việc phát hành đầy đủ sẽ diễn ra trong suốt nửa đầu năm 2026. Tuy nhiên, trên thực tế, đã có các mô hình V4 được đăng tải trên các kho lưu trữ công cộng, sẵn sàng để thử nghiệm và triển khai trong môi trường phòng thí nghiệm.
Đối với các tổ chức châu Âu và Tây Ban Nha, việc tiếp cận hiện đang tập trung vào... API công khai, tải xuống từ kho lưu trữ mã nguồn mở và thử nghiệm trên các nền tảng điện toán đám mây quốc tế.Việc triển khai trên cơ sở hạ tầng nội bộ sẽ phụ thuộc vào khả năng có được các GPU tương thích hoặc, nếu cần thiết, phần cứng Trung Quốc được phê duyệt, điều này có thể xung đột với các yêu cầu về bảo mật nội bộ và tuân thủ quy định.
Những tác động đối với các công ty khởi nghiệp và các doanh nghiệp tại Tây Ban Nha và châu Âu
Đối với môi trường kinh doanh năng động của Tây Ban Nha và các quốc gia EU khác, DeepSeek V4 đại diện cho một... khả năng dân chủ hóa việc tiếp cận các mô hình quy mô "doanh nghiệp".Với chi phí mỗi triệu token thấp hơn nhiều và tùy chọn thực thi cục bộ, các dự án trước đây cần nhiều vòng gọi vốn để trang trải chi phí cho API và GPU giờ đây có thể xem xét các nguyên mẫu cấp cao với nguồn lực hạn chế hơn.
Trong các lĩnh vực như Công nghệ tài chính, công nghệ pháp lý, y tế kỹ thuật số hoặc phân tích dữ liệuKhả năng xử lý lượng dữ liệu khổng lồ và duy trì dữ liệu trong các hạ tầng do chính công ty kiểm soát có thể tạo nên sự khác biệt lớn trong việc đáp ứng các yêu cầu. Quy định bảo vệ dữ liệu của châu ÂuTuy nhiên, sự chiếm ưu thế của tiếng Anh và tiếng Trung trong các văn bản chính thức, cũng như ưu tiên dành cho các ngôn ngữ này trong đào tạo, cho thấy rằng Tiếng Tây Ban Nha cần được trau chuốt thêm. để đạt được hiệu suất cạnh tranh thực sự.
Một vấn đề khác là sự trưởng thành của hệ sinh thái công cụ xung quanh DeepSeek V4. Không giống như các mô hình như Llama hoặc GPT, vốn có khung phần mềm mã nguồn mởPhiên bản 4 khởi đầu với ít hỗ trợ mặc định hơn. Các công ty có đội ngũ kỹ thuật nhỏ cần đánh giá xem họ có thể xử lý được quá trình tích hợp đó hay không, hoặc liệu họ có muốn chờ đợi cho đến khi môi trường trở nên ổn định hơn.
Khía cạnh địa chính trị và pháp lý: Trí tuệ nhân tạo như một lĩnh vực xung đột mới.
Sự xuất hiện của V4 diễn ra trong bối cảnh mà Trí tuệ nhân tạo là một yếu tố then chốt tạo nên sức mạnh kinh tế và chiến lược.Mô hình cạnh tranh cởi mở của Trung Quốc gây áp lực lên quan điểm của phương Tây về vai trò lãnh đạo công nghệ và làm gia tăng căng thẳng trong cuộc thảo luận về vấn đề này. sự phụ thuộc công nghệ và các tiêu chuẩn toàn cầu.
Trong khi Trung Quốc đáp trả thách thức bằng một... Cung cấp năng lực sản xuất công nghiệp, chip độc quyền và triển khai nhanh chóng.Châu Âu có xu hướng tăng cường yếu tố pháp lý và các yêu cầu về tính minh bạch, an ninh và đạo đức. Khả năng các mô hình mở có nguồn gốc từ Trung Quốc trở thành chuẩn mực toàn cầu có thể khuyến khích các chính phủ châu Âu. nâng cao các rào cản pháp lýVí dụ, trong đấu thầu công hoặc các lĩnh vực trọng yếu.
Điều này có thể dẫn đến Thị trường AI bị phân mảnh theo từng khối.Trong bối cảnh này, các công ty Tây Ban Nha và châu Âu phải lựa chọn giữa các mô hình của Mỹ bị ràng buộc chặt chẽ bởi các quy tắc sử dụng riêng, các giải pháp của châu Âu vẫn đang trong giai đoạn phát triển, và các đề xuất mạnh mẽ của Trung Quốc với yếu tố địa chính trị phức tạp. DeepSeek V4, với sự kết hợp giữa mã nguồn mở, chi phí thấp và sự hỗ trợ từ Huawei, nằm ngay trung tâm của cuộc tranh luận này.
Nhìn chung, DeepSeek V4 đang dần trở thành một trong những ứng cử viên nặng ký nhất cho vị trí dẫn đầu. Đưa các mô hình ngôn ngữ cấp cao vào lĩnh vực mã nguồn mở và chính sách giá cả cạnh tranh.Khả năng xử lý ngữ cảnh khổng lồ, liên minh với các phần cứng thay thế cho NVIDIA, và tập trung vào các tác nhân và suy luận khiến nó trở thành một lựa chọn đáng theo dõi sát sao từ Tây Ban Nha và phần còn lại của châu Âu; tác động thực sự sẽ phụ thuộc vào hiệu suất hoạt động trong môi trường sản xuất, sự hỗ trợ thực tế bằng tiếng Tây Ban Nha, và mức độ sẵn sàng của các công ty trong việc tích hợp một phần quan trọng của cơ sở hạ tầng AI từ hệ sinh thái công nghệ Trung Quốc.