Trung Quốc đang lãng phí tài nguyên cho các mô hình ngôn ngữ lớn (LLM)_kèo colombia
Tính đến tháng 10,ốcđanglãngphítàinguyênchocácmôhìnhngônngữlớkèo colombia hơn 200 mô hình ngôn ngữ lớn (LLM) đã được các công ty và viện nghiên cứu Trung Quốc tung ra thị trường, dẫn đến một cuộc “đấu đá” khốc liệt tại nền kinh tế lớn thứ hai thế giới.
Sự cạnh tranh là cần thiết để thúc đẩy đổi mới sáng tạo, song trong bối cảnh cụ thể của Bắc Kinh, số lượng LLM tăng lên quá nhanh, sẽ là một sự lãng phí tài nguyên to lớn.
Thị trường AI đông đúc của Trung Quốc đang bị hạn chế do thiếu khả năng tiếp cận dòng chip tiên tiến, các quy định nghiêm ngặt từ chính phủ liên quan chủ đề nhạy cảm, chi phí phát triển cao, cũng như thị trường công nghệ bị phân mảnh sâu sắc.
Thiếu sức mạnh tính toán
“Trung Quốc phải đối mặt với nhiều thách thức trong việc phát triển LLM khi khoảng cách công nghệ ngày càng lớn với phương Tây do sự ra đời của GPT và Gemini của Google”, Su Lian Jye, giám đốc phân tích tại Omdia cho biết.
Thách thức lớn nhất là thiếu khả năng tiếp cận các đơn vị xử lý đồ họa (GPU) tiên tiến từ Nvidia do các lệnh trừng phạt thương mại của Mỹ. Những GPU này, chẳng hạn như H100 của Nvidia, được coi là trái tim của các LLM mới nhất, quyết định lớn tới mức độ mạnh mẽ của mô hình này.
Một tháng trước khi OpenAI ra mắt GPT, Washington áp đặt lệnh quyền truy cập của Bắc Kinh vào các chip tiên tiến như H100 và A100 của Nvidia vì lý do an ninh quốc gia. Sau đó một năm, chính phủ Mỹ tiếp tục thắt chặt hơn nữa với các vi xử lý tinh chỉnh dành riêng cho thị trường Trung Quốc như A800 và H800, đồng thời đe doạ cấm mọi giải pháp thay thế trong tương lai.
Wang Shuyi, giáo sư chuyên ngành AI và máy học tại Đại học Sư phạm Thiên Tân, cho biết sức mạnh tính toán không đủ là một trong những trở ngại chính đối với việc phát triển mô hình AI ở Trung Quốc.
“Trung Quốc sẽ ngày càng khó tiếp cận được chip tiên tiến”, Wang nói. “Doanh nghiệp Trung Quốc không thiếu tiền nhưng không có sức mạnh tính toán, họ sẽ không thể tận dụng đầy đủ các nguồn dữ liệu chất lượng cao”.
Và với việc các công ty trong nước vẫn còn tụt hậu trong lĩnh vực sản xuất chip, Trung Quốc sẽ khó có thể sớm vượt qua những hạn chế này.
Lãng phí tài nguyên to lớn
Robin Li Yanhong, đồng sáng lập và giám đốc điều hành của gã khổng lồ công cụ tìm kiếm Baidu, cho biết việc ra mắt nhiều LLM cạnh tranh ở Trung Quốc là “sự lãng phí tài nguyên rất lớn” và các công ty nên tập trung nhiều hơn vào các ứng dụng.
Wang Xiaochuan, Giám đốc điều hành của công ty khởi nghiệp AI Baichuan, đã phát biểu tại một diễn đàn công nghệ Tencent tại Bắc Kinh rằng nhiều công ty nên hạn chế đào tạo mô hình của riêng mình và “thay vào đó hãy tập trung nỗ lực vào việc tìm kiếm các sản phẩm AI có tính thương mại và có thể mở rộng bằng cách khai thác các mô hình hiện có thông qua đám mây".
Trong khi đó, Luo Yuchen, Giám đốc điều hành của Thâm Quyến Yantu Intelligence and Innovation đánh giá, “mặc dù hiện tại không có nền tảng nào nổi lên chiếm ưu thế về mặt công nghệ hoặc quy mô thị trường”, nhưng việc phát triển mô hình nên “tiếp tục vì ngay cả GPT-4 cũng có thể không đủ tốt để giúp các công ty giải quyết các công việc hàng ngày do con người xử lý”.
Theo Su Lian Jye của Omdia, chất lượng dữ liệu hạn chế từ Internet dựa trên tiếng Quan Thoại so với thế giới nói tiếng Anh, cũng có thể là những trở ngại với tham vọng trở thành cường quốc AI của Bắc Kinh.
Sự khác biệt về cấu trúc ngôn ngữ giữa tiếng Anh và tiếng Trung, cùng với những nhạy cảm xung quanh vấn đề chính trị giữa Trung Quốc và phương Tây, đồng nghĩa có sự phân chia rõ ràng giữa thị trường trong nước và thị trường toàn cầu của các phản hồi chatbot AI.
(Theo SCMP)