Reddit muốn thu tiền sử dụng dữ liệu đối với Microsoft, Google_kqbd cúp ý


Reddit là một trong những diễn đàn lớn nhất Internet. Khoảng 57 triệu người truy cập website hàng ngày để thảo luận về đủ các chủ đề. Trong những năm gần đây,ốnthutiềnsửdụngdữliệuđốivớkqbd cúp ý dữ liệu của Reddit còn trở thành công cụ hỗ trợ đào tạo AI miễn phí cho Google, OpenAI, Microsoft. Các hãng này dùng những cuộc thảo luận trên diễn đàn trong quá trình phát triển các hệ thống AI.
Ngày 18/4, Reddit thông báo kế hoạch bắt đầu thu phí những công ty truy cập API (giao diện lập trình ứng dụng) của mình. Steve Huffman, nhà sáng lập kiêm CEO Reddit, khẳng định “kho dữ liệu Reddit thực sự có giá trị” và không thể biếu không những hãng giàu nhất thế giới.
Thành lập năm 2005, Reddit kiếm tiền chủ yếu qua quảng cáo và giao dịch thương mại điện tử trên nền tảng. Diễn đàn vẫn đang hoàn thiện các chi tiết về việc thu phí và sẽ báo giá trong vài tuần tới.
Những cuộc hội thoại trên Reddit hay tương tự trở thành món hàng giá trị khi mô hình ngôn ngữ lớn (LLM) đóng vai trò thiết yếu trong tạo ra công nghệ AI mới. LLM là những thuật toán tinh vi mà trong đó, dữ liệu từ Reddit được nạp vào để phát triển. Dịch vụ Google Bard hay ChatGPT đều sử dụng dữ liệu Reddit.
ChatGPT mang đến nhiều lợi ích cho công ty đứng sau nhưng không có ích lợi gì với Reddit. Thực tế, nó còn có thể bị lợi dụng để tạo ra các đối thủ của Reddit. Một số công ty khác cũng bắt đầu bán dữ liệu cho những nhà phát triển AI. Chẳng hạn, Shutterstock bán dữ liệu ảnh cho OpenAI để phát triển chương trình tạo ảnh từ văn bản Dall-E.
Tuần trước, Elon Musk nói sẽ kiểm soát việc sử dụng API của Twitter khi hàng nghìn công ty và nhà phát triển độc lập sử dụng nó để theo dõi hàng triệu cuộc hội thoại trên nền tảng. Mức phí có thể dao động từ vài nghìn đến vài trăm nghìn USD.
Để LLM liên tục được cải thiện, các hãng cần hai thứ: năng lực điện toán khổng lồ và dữ liệu khổng lồ. Một vài hãng đã sở hữu năng lực điện toán lớn nhưng vẫn tìm kiếm dữ liệu bên ngoài để nâng cấp thuật toán. Chúng bao gồm những nguồn như Wikipedia, sách điện tử, bài báo học thuật hay Reddit.
Huffman tin rằng dữ liệu của họ có giá trị một phần vì nó liên tục được cập nhật. Tính mới mẻ và liên quan là thứ mà các mô hình ngôn ngữ lớn cần để cho ra kết quả tốt nhất. Ông cho biết, API của Reddit vẫn miễn phí với các nhà phát triển muốn viết ứng dụng phục vụ cộng đồng Reddit hay các học giả muốn nghiên cứu dữ liệu cho mục đích học thuật hoặc phi thương mại.
Theo Huffman, việc các công ty thu thập dữ liệu, tạo ra giá trị nhưng không trả lại gì cho người dùng Reddit là một vấn đề. Vì thế, đây là thời điểm tốt để siết chặt mọi thứ.
(Theo NYT)

CEO Reddit chê Elon Musk lạc hậu về văn hóa Internet
“Nếu thâu tóm Twitter, Elon Musk sẽ rơi vào cảnh khốn đốn, vì ông ấy không hề có sự chuẩn bị”, cựu CEO của Reddit khẳng định.
相关文章
Sao Việt ngày 1/11: Lý Nhã Kỳ gợi cảm, chồng Việt Hương giả gái
Lý Nhã Kỳ vừa có chuyến xuất ngoại sang Qatar tham gia sự kiện thời trang của công chúa nước này và2025-03-28Điều chỉnh quy hoạch chi tiết trung tâm chính trị Ba Đình
Thủ tướng vừa có văn bản kết luận việc điều chỉnh quy hoạch chi tiết khu trung tâm chính trị Ba Đình2025-03-28Tin chuyển nhượng: Arsenal chơi canh bạc lớn, Klopp ôm đầu nhận tin dữ
- Arsenal sẵn sàng bán Alexis Sanchez và đưa Benzema về thế chỗ, Jurgen Klopp mất Lallana một tháng2025-03-28Thứ trưởng Bộ Xây dựng vẫn phải ở nhà tạm
"Nhiều lãnh đạo của các cơ quan cấp Bộ vẫn còn đang phải ở trong nhà khách, với các phòng chật chội2025-03-28Hoàng Thùy Linh sắp rút phim khỏi rạp, doanh thu hiện hơn 200 triệu đồng
Chiều 20/3, ca sĩ Hoàng Thùy Linh thông báo cô sẽ rút phim tài liệu Vietnamese concert: Chúng ta là2025-03-28Ngủ phải 'phân ca' vì ở nhà quá chật
Muốn ngủ ở nhà phải “phân ca”, tắm thì túc trực, ăn cơm ngồi khép nép,đi lại khúm núm… Đó là tình cả2025-03-28
最新评论