Mới đây, một nghiên cứu của Copyleaks đã tiết lộ rằng phong cách ngôn ngữ của DeepSeek có mức độ tương đồng đáng kể với ChatGPT, lên tới 74,2%. Kết quả này dấy lên nhiều tranh luận về tính nguyên bản của mô hình AI đến từ Trung Quốc cũng như các vấn đề liên quan đến quyền sở hữu trí tuệ trong lĩnh vực trí tuệ nhân tạo.
PHÁT HIỆN ĐÁNG CHÚ Ý TỪ NGHIÊN CỨU CỦA COPYLEAKS
Nghiên cứu, được công bố trên arXiv.org ngày 3/3, sử dụng công nghệ sàng lọc tiên tiến để phân tích dấu vân tay phong cách của nhiều mô hình AI, bao gồm OpenAI, Claude, Google Gemini, Meta Llama và DeepSeek. Trong khi các mô hình khác có phong cách riêng biệt, DeepSeek lại có dấu hiệu tương đồng cao với ChatGPT, thậm chí nhiều đầu ra từ DeepSeek bị nhận diện như sản phẩm của OpenAI.
Theo ông Shai Nisan, Giám đốc khoa học dữ liệu tại Copyleaks, nghiên cứu này tương tự như việc các chuyên gia giám định chữ viết tay cố gắng xác định tác giả một bản thảo. Ông nhấn mạnh rằng sự giống nhau giữa DeepSeek và ChatGPT là điều bất thường và đặt ra câu hỏi về cách DeepSeek được đào tạo.
LIỆU DEEPSEEK CÓ SỬ DỤNG DỮ LIỆU TỪ OPENAI?
Một trong những vấn đề quan trọng được đặt ra là khả năng DeepSeek đã sử dụng đầu ra từ ChatGPT để huấn luyện mô hình của mình. Nếu điều này đúng, nó có thể vi phạm quyền sở hữu trí tuệ và điều khoản sử dụng của OpenAI. Đây không phải lần đầu tiên DeepSeek gây tranh cãi. Trước đó, mô hình DeepSeek V3 từng bị phát hiện tự nhận là ChatGPT khi được truy vấn, khiến nhiều chuyên gia nghi ngờ về nguồn gốc đào tạo của nó.
Một giả thuyết được đưa ra là DeepSeek có thể đã sử dụng kỹ thuật “chưng cất” kiến thức từ các mô hình AI khác. Kỹ thuật này giúp các mô hình nhỏ hoạt động hiệu quả bằng cách học hỏi từ đầu ra của các mô hình lớn. Tuy nhiên, nếu DeepSeek thực sự đã sử dụng dữ liệu từ OpenAI mà không có sự cho phép, điều này có thể dẫn đến hậu quả pháp lý nghiêm trọng.

Ứng dụng DeepSeek
TÁC ĐỘNG ĐỐI VỚI NGÀNH AI VÀ CÁC QUY ĐỊNH QUẢN LÝ
Việc phát hiện sự tương đồng giữa DeepSeek và ChatGPT có thể mở ra nhiều tranh luận về tính minh bạch trong dữ liệu đào tạo AI. Các chuyên gia cho rằng cần có các quy định chặt chẽ hơn nhằm yêu cầu các công ty AI công khai về nguồn dữ liệu họ sử dụng. Điều này không chỉ giúp đảm bảo công bằng trong ngành mà còn bảo vệ quyền sở hữu trí tuệ của các bên liên quan.
Hiện tại, cả OpenAI và DeepSeek vẫn chưa đưa ra phản hồi chính thức về những phát hiện này. Tuy nhiên, nếu có thêm bằng chứng về việc DeepSeek sử dụng dữ liệu từ OpenAI mà không có sự đồng ý, đây có thể trở thành một trong những vụ việc quan trọng liên quan đến sở hữu trí tuệ trong ngành AI.
Sự phát triển nhanh chóng của trí tuệ nhân tạo đang đặt ra nhiều thách thức pháp lý và đạo đức. Những phát hiện mới từ Copyleaks có thể là bước đầu trong việc thúc đẩy sự minh bạch và công bằng hơn trong lĩnh vực đầy tiềm năng nhưng cũng không ít tranh cãi này.
Nếu bạn là doanh nghiệp đang trong thời kỳ chuyển đổi số, muốn tìm cho mình một giải pháp quản lý mua hàng hiệu quả, hãy liên hệ ngay đến với APETECHS để được tư vấn về giải pháp phù hợp cho doanh nghiệp của bạn!
Website: https://apetechs.com/
Hotline: 0939795266
Email: [email protected]
APE Techs – Giải pháp quản lý mua hàng hàng đầu cho doanh nghiệp Việt Nam.