From Wikipedia, the free encyclopedia
Trí tuệ nhân tạo tạo sinh hoặc AI tạo sinh[ghi chú 1] là một loại hệ thống AI có khả năng tạo ra văn bản, hình ảnh hoặc các phương tiện truyền thông khác dựa trên các lệnh nhắc (prompt).[4][5] Các mô hình AI tạo sinh học các mô hình và cấu trúc của dữ liệu đầu vào của chúng bằng cách áp dụng các kỹ thuật học máy mạng nơ-ron, sau đó tạo ra dữ liệu mới có các đặc điểm tương tự.[6][7]
Các hệ thống AI tạo sinh đáng chú ý bao gồm ChatGPT (và biến thể của nó là Bing Chat), một chatbot được xây dựng bởi OpenAI sử dụng các mô hình ngôn ngữ lớn nền tảng GPT-3 và GPT-4 của họ,[8] và Bard (chatbot), một chatbot được xây dựng bởi Google sử dụng mô hình nền tảng LaMDA.[9] Các mô hình AI tạo sinh khác bao gồm các hệ thống nghệ thuật AI như Stable Diffusion, Midjourney và DALL-E.[10]
AI tạo sinh có tiềm năng ứng dụng trong nhiều ngành công nghiệp, bao gồm nghệ thuật, viết lách, phát triển phần mềm, thiết kế sản phẩm, chăm sóc sức khỏe, tài chính, trò chơi, tiếp thị và thời trang.[11][12][13] Đầu tư vào AI tạo sinh đã tăng vọt trong những năm đầu của thập kỷ 2020, với các công ty lớn như Microsoft, Google và Baidu cũng như nhiều công ty nhỏ hơn đang phát triển các mô hình trí tuệ nhân tạo tạo sinh.[4][14][15] Tuy nhiên, cũng có những lo ngại về việc sử dụng sai mục đích của AI tạo sinh, chẳng hạn như tạo tin giả hoặc deepfake, có thể được sử dụng để lừa dối hoặc thao túng con người.[16]
Kể từ khi thành lập, lĩnh vực học máy (machine learning) đã sử dụng các mô hình thống kê, bao gồm cả mô hình tạo sinh, để mô hình hóa và dự đoán dữ liệu. Bắt đầu từ cuối những năm 2000, sự xuất hiện của học sâu (deep learning) đã thúc đẩy tiến bộ và nghiên cứu trong xử lý ảnh và video, phân tích văn bản, nhận dạng giọng nói và các tác vụ khác. Tuy nhiên, hầu hết các mạng thần kinh sâu được đào tạo như các mô hình phân biệt thực hiện các tác vụ phân loại như phân loại hình ảnh dựa trên mạng thần kinh tích chập.
Năm 2014, những tiến bộ như autoencoder biến đổi (VAE) và mạng đối nghịch tạo sinh đã tạo ra các mạng thần kinh sâu thực tế đầu tiên có khả năng học các mô hình tạo sinh, thay vì phân biệt, của dữ liệu phức tạp như hình ảnh. Các mô hình tạo sinh sâu này là những mô hình đầu tiên có thể xuất ra không chỉ tạo nhãn (label) cho hình ảnh, mà còn có thể xuất ra toàn bộ hình ảnh.[17]
Năm 2017, mạng Transformer đã cho phép phát triển các mô hình tạo sinh, dẫn đến Generative pre-trained transformer (GPT) đầu tiên vào năm 2018.[18] Tiếp theo là GPT-2 vào năm 2019, đã chứng minh khả năng tạo sinh không giám sát cho nhiều tác vụ khác nhau như một mô hình nền tảng (Foundation model).[19]
Năm 2021, sự ra mắt của DALL-E, một mô hình tạo sinh pixel dựa trên transformer, tiếp theo là Midjourney và Stable Diffusion đã đánh dấu sự xuất hiện của nghệ thuật trí tuệ nhân tạo chất lượng cao thực tế từ các lời nhắc hoặc gợi ý (prompt).
Vào tháng 1 năm 2023, Futurism.com đã đưa tin rằng CNET đã sử dụng một công cụ AI nội bộ không được tiết lộ để viết ít nhất 77 câu chuyện của mình; sau khi tin tức được công bố, CNET đã đăng các bản sửa lỗi cho 41 câu chuyện.[20]
Vào tháng 3 năm 2023, GPT-4 đã được phát hành. Một nhóm từ Microsoft Research lập luận rằng "nó có thể được xem một cách hợp lý như một phiên bản ban đầu (nhưng vẫn chưa hoàn chỉnh) của hệ thống trí tuệ tổng quát nhân tạo (AGI)".[21]
Hệ thống AI tạo sinh được xây dựng bằng cách áp dụng học máy không giám sát hoặc tự giám sát cho một tập dữ liệu. Khả năng của hệ thống AI tạo sinh phụ thuộc vào mô-đun hoặc loại của tập dữ liệu được sử dụng.
AI tạo sinh có thể là đơn mô-đun/phương thức (uni-modal) hoặc đa mô-đun/phương thức (multi-modal); hệ thống đơn mô-đun/phương thức chỉ nhận một loại đầu vào, trong khi hệ thống đa mô-đun/phương thức có thể nhận nhiều hơn một loại đầu vào.[22] Ví dụ, GPT-4 của OpenAI chấp nhận cả đầu vào văn bản và hình ảnh.[23]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.