Generative AI là xu hướng công nghệ đột phá bùng nổ vào năm 2023, thu hút sự chú ý không chỉ của các nhà công nghệ và nhà tương lai học mà cả khán giả phổ thông nhờ khả năng tạo ra nội dung có vẻ giống con người.

Với việc những gã khổng lồ công nghệ bao gồm Microsoft, Google và Meta rót nguồn lực dường như vô hạn của họ vào công nghệ, chúng ta có thể mong đợi sự đổi mới mang tính thay đổi trò chơi không kém vào năm 2024.

AI sáng tạo là một công cụ cực kỳ mạnh mẽ, sẽ đóng một vai trò quan trọng trong việc dân chủ hóa khả năng tiếp cận tiềm năng biến đổi của AI. Và tôi tin rằng mọi người cần nhận thức được điều gì sắp xảy ra để xem xét cẩn thận tác động của nó đối với cuộc sống của chúng ta.

Vì vậy, đây là tóm tắt của tôi về những gì tôi mong đợi sẽ là chủ đề chính, bao gồm những đột phá công nghệ mới cũng như các vấn đề xã hội mà chúng ta có thể gặp phải.

Các mô hình lớn hơn và mạnh mẽ hơn
Các ứng dụng AI sáng tạo rất ấn tượng vì chúng được đào tạo trên các bộ dữ liệu khổng lồ. GPT-4, công cụ đằng sau ChatGPT, được cho là đã đào tạo hơn một nghìn tỷ thông số. Các mô hình ngôn ngữ lớn (LLM) khác như PaLM2 của Google và Gopher của DeepMind được đào tạo trên hàng trăm tỷ tham số. Tin đồn đang nóng lên rằng GPT-5 có thể sắp xuất hiện và chúng ta có thể mong đợi một bước tiến lớn khác về quy mô. Tăng kích thước của tập dữ liệu không phải là cách duy nhất để làm cho LLM thông minh hơn nhưng cho đến nay, nó đã được chứng minh là cách đáng tin cậy nhất để tạo ra các cải tiến. Vì điều này, tôi mong đợi sẽ thấy sự phát triển của các mô hình AI thế hệ mới vào năm 2024.

Can thiệp bầu cử

Vào năm 2024, chúng ta sẽ chứng kiến các cuộc bầu cử lãnh đạo ở nhiều quốc gia, bao gồm Hoa Kỳ, Vương quốc Anh và Ấn Độ. Tôi khá tự tin rằng chúng ta sẽ thấy AI tổng hợp được sử dụng để truyền bá thông tin sai lệch và phá vỡ tiến trình chính trị. Điều này có thể là thông qua việc sử dụng các tác phẩm deepfake ngày càng thuyết phục hơn, cũng như việc sử dụng các công cụ như ChatGPT để tạo ra lượng tuyên truyền khổng lồ và phân phối nó trên quy mô lớn. Tất nhiên, các chính trị gia và đảng phái cũng sẽ sử dụng nó để tạo các thông điệp và email chiến dịch được cá nhân hóa.

Thiết kế sáng tạo

Một lĩnh vực khác mà chúng ta có thể kỳ vọng sẽ thấy AI được áp dụng nhanh chóng là thiết kế các sản phẩm và dịch vụ vật lý. Generative Design là tên được đặt cho một loại công cụ mới nổi cho phép các nhà thiết kế chỉ cần nhập các yêu cầu và vật liệu có sẵn cũng như nhận được bản thiết kế và công thức nấu ăn. Các nền tảng thiết kế như Autodesk đang kết hợp chức năng AI tổng quát, cho phép các nhà thiết kế sản phẩm nhanh chóng tạo ra bất kỳ số lượng nguyên mẫu nào dưới dạng bản sao kỹ thuật số và thử nghiệm chúng song song để đưa ra các thiết kế sản phẩm mạnh mẽ, hiệu quả hoặc bền vững hơn.

Video sáng tạo

Video là định dạng phương tiện truyền thông ưa thích của thế hệ trẻ, vì vậy không có gì ngạc nhiên khi các nhà sản xuất công cụ AI đã nhanh chóng đưa ra các công cụ khai thác xu hướng này. Việc tạo nội dung video theo truyền thống rất tốn kém, chủ yếu là do nhu cầu thuê một chuyên gia được đào tạo để tạo, quay hoặc chỉnh sửa cảnh quay. Với các công cụ video tổng hợp, bất kỳ ai cũng có thể tạo ra nội dung video có giao diện chuyên nghiệp với chi phí thấp vào năm 2024.

4 âm thanh và lời nói sáng tạo

Cũng như các công cụ thiết kế và video, năm 2024 sẽ là năm mà âm thanh và lời nói do AI tạo ra trở nên phổ biến như các từ và hình ảnh do AI tạo ra vào năm 2023. Tôi kỳ vọng sẽ thấy được những phẩm chất tinh vi của robot thường vẫn có thể được phát hiện ở tất cả ngoại trừ giọng nói phức tạp nhất do AI tạo ra bắt đầu biến mất khi các công cụ mô phỏng âm sắc và ngữ điệu tạo nên lời nói của con người trở nên tốt hơn.

5 mô hình đa phương thức

Hầu hết các công cụ, thuật toán và LLM AI tổng quát đều chuyên mô phỏng một “chế độ” biểu đạt – chẳng hạn như ngôn ngữ, hình ảnh hoặc âm thanh. Tuy nhiên, xu hướng này là hướng tới AI tạo ra “đa phương thức”. Phiên bản sắp tới của ChatGPT của OpenAI sẽ có khả năng hiểu và diễn giải hình ảnh, cũng như nhận lệnh thoại và nói chuyện lại với chúng ta. Meta cũng đã trình diễn một mô hình có thể tập hợp các hình ảnh, văn bản, âm thanh, độ sâu và dữ liệu quán tính. Đây là điều sẽ trở nên phổ biến hơn trong năm tới và sẽ sớm trở nên bình thường khi có thể nói chuyện với AI về một bức ảnh hoặc video giống như cách chúng ta có thể nói với nó về văn bản ngày nay.

Kỹ sư nhanh chóng có nhu cầu cao

Nhắc nhở các kỹ sư “lập trình” các hệ thống AI tổng hợp bằng cách mô tả những gì họ muốn chúng làm theo những thuật ngữ có nhiều khả năng dẫn đến kết quả tối ưu nhất. Nó được mô tả là “công việc mới hấp dẫn nhất trong lĩnh vực công nghệ” vào năm 2023 và nhu cầu về nó có thể sẽ tăng vào năm 2024. Công việc này còn được gọi là “AI thì thầm” vì nó liên quan đến việc có thể khai thác những hệ thống tốt nhất có thể đôi khi có vẻ phức tạp, khó hiểu và đáng sợ.

AI sáng tạo tự trị

Tác nhân tự trị là một thuật ngữ được sử dụng để mô tả một lớp ứng dụng AI tổng hợp có khả năng tự vận hành hiệu quả bằng cách liên tục tạo và phản hồi các lời nhắc. Bằng cách này, họ có thể thực hiện các hoạt động phức tạp hơn

Share this post

Sử dụng Gmail để trải nghiệm tại đây

;