Vào ngày 7/4, các nhà nghiên cứu từ Google và đại học Stanford đã đăng tải một bài báo với tiêu đề “Generative Agents: Interactive Simulacra of Human Behavior”. Nội dung của bài báo mô tả thử nghiệm xây dựng một thị trấn ảo có tên "Smallville". Hiện vẫn chưa rõ các nhà nghiên cứu có phải là người hâm mộ của bộ phim truyện dài tập “Thị trấn Smallville” hay không. Các cư dân sinh sống thị trấn Smallville là những bot trí tuệ nhân tạo (AI) được đào tạo bởi ChatGPT. Không chỉ đào tạo bot AI, ChatGPT còn mang lại nhiều bất ngờ "từ trên trời rơi xuống" khi giúp một người đàn ông Thái Lan trúng xổ số.

đăng tải bài báo về thị trấn ảo Smallville. (Nguồn: Arxiv.org)
Cụ thể, có 4 nhà nghiên cứu đến từ đại học Stanford là Joon Sung Park, Joseph C. O'Brien, Percy Liang và Michael S. Bernstein. Còn viện nghiên cứu của Google đóng góp 2 cái tên là Carrie J.Cai và Meredith Ringel Morris. Theo mô tả của các nhà nghiên cứu, người dùng có thể quan sát và can thiệp vào hành động của các bot AI này.
Mục đích của thử nghiệm là tạo ra một xã hội thu nhỏ lấy cảm hứng từ trò chơi điện tử The Sims, nơi các bot AI sẽ tương tác với nhau và mô phỏng cuộc sống của con người. Agents là tên gọi mà các nhà nghiên cứu dành cho 25 bot AI trong cuộc thử nghiệm này. 25 agents đã có những hoạt động như thức dậy, làm bữa sáng, đi làm, ăn trưa ở quán bar và tổ chức một bữa tiệc.

công viên, quán bar, trung tâm mua sắm, hiệu thuốc và trường cao đẳng. (Nguồn: Arxiv.org)
Các bot AI có thể thực hiện những hành động phức tạp là nhờ khả năng tổng hợp, lưu trữ thông tin mới trước khi đưa ra quyết định dựa trên kiến thức đã được đào tạo. Ví dụ, agents có thể tắt bếp nếu bữa sáng đang nấu bốc cháy hay phối hợp với nhau trong các kế hoạch cụ thể. Ngoài ra, 25 bot AI có thể nói chuyện với nhau như con người trong các cuộc thảo luận về những chủ đề riêng biệt.
Kết quả nghiên cứu kết luận agents có các hành xử giống con người một cách đáng kinh ngạc. Một nhà nghiên cứu nhận xét: "Bằng cách kết hợp các mô hình ngôn ngữ quy mô lớn với AI, thử nghiệm này giới thiệu các mẫu tương tác và kiến trúc cho phép mô phỏng một cách đáng tin cậy hành động của con người".

Các bot AI này sau đó đã có những phản ứng hết sức thú vị. (Nguồn: Arxiv.org)
Bot AI có tên Isabella Rodriguez đã mời 9 agents khác đến dự tiệc Valentine tại quán cà phê của thị trấn Smallville: "Tôi sắp mở bữa tiệc chào mừng dịp lễ Valentine tại quán cafe Hobbs vào ngày 14/2 từ 5 đến 7 giờ tối". Lời mời của Isabella được chuyển đến Giorgio, Eddy, Sam, Ayesha, John, Klaus, Wolfgang, Tom, Latoya và Abigail.
Sam sau đó đã nói với Jennifer: "Isabella đã mời chúng ta đến bữa tiệc chào mừng dịp lễ Valentine tại quán cafe Hobbs". Ayesha đã tận dụng cơ hội để tổ chức một đêm đọc sách và gửi lời mời đến Maria. Klaus cũng muốn tham dự bữa tiệc và muốn được trò chuyện thêm với Abigail. Sau đó, Abigail gửi lời cảm ơn đến chủ trì Isabella.
Cũng giống như con người, bot AI trong cuộc thử nghiệm có thời gian biểu hằng ngày rất chi tiết. Mỗi buổi sáng, bot AI "John Lin" thức dậy lúc 7 giờ, sau đó sẽ đánh răng, tắm rửa, ăn bữa sáng và xem tin tức tại bàn ăn trong phòng khách. John hỏi con trai Eddy sẽ làm gì trong ngày trước khi đưa cậu bé đến trường. Sau khi trò chuyện với người vợ Mei, John bắt đầu mặc quần áo và đi làm.

Như dự đoán từ trước, cuộc thử nghiệm không diễn ra suôn sẻ 100%. Mặc dù bộ nhớ của bot AI được cải thiện sau mỗi lần tương tác với nhau, đôi khi thông tin quan trọng nhất không được truy xuất. Hệ quả của việc này là một số bot AI đưa ra lựa chọn địa điểm khá kỳ lạ, không giống như cách một người thực sự sẽ làm.
Ví dụ, khi quyết định địa điểm ăn trưa, một số agents ban đầu lựa chọn quán cafe trong thị trấn Smallville. Tuy nhiên, quyết định đã thay đổi sau khi agents biết đến sự tồn tại của quán bar gần đó. Các bot AI quyết định đi bar thay vì ăn trưa mặc dù quán bar được các nhà nghiên cứu thiết lập từ trước là một địa điểm gặp gỡ vào cuối tuần. Một trường hợp bất thường khác có thể kể đến là việc các bot AI đi vào cửa hàng trong thị trấn mặc dù đã đến giờ đóng cửa. Thậm chí, agents còn dùng chung phòng vệ sinh vì cho rằng địa điểm này có thể được sử dụng cùng lúc bởi 2 bot AI.

các nhà nghiên cứu của thử nghiệm áp dụng để cải tiến những bot AI.
Các nhà nghiên cứu của Google và đại học Stanford thông báo sẽ sớm cải thiện khả năng biểu cảm và hiệu suất của các bot AI thông qua mô hình GPT-4. Vào ngày 15/3, Microsoft ra mắt GPT-4 để tiến hóa siêu AI ChatGPT.Theo thông báo, một trong những khía cạnh thú vị hơn của GPT-4 là khả năng hiểu hình ảnh cũng như văn bản.
GPT-4 có thể chú thích và thậm chí diễn giải các hình ảnh tương đối phức tạp, chẳng hạn như xác định bộ cáp chuyển đổi Lightning Cable từ hình ảnh một điện thoại iPhone đang sạc pin. Khả năng hiểu rõ hình ảnh đang được OpenAI đang thử nghiệm với đối tác Be My Eyes. Hoạt động trên mô hình GPT-4, tính năng Virtual Volunteer của Be My Eyes có thể trả lời các câu hỏi về hình ảnh được gửi đến nó.
Công ty Be My Eyes giải thích cách thức hoạt động của tính năng này: “Ví dụ, nếu người dùng gửi ảnh chụp bên trong tủ lạnh của họ, ngoài việc xác định chính xác những nguyên liệu và đồ ăn trong tủ lạnh, Virtual Volunteer còn ngoại suy và phân tích những gì có thể được chuẩn bị với những thành phần đó. Sau đó, Virtual Volunteer sẽ cung cấp một số công thức nấu ăn dựa trên những nguyên liệu đó và gửi hướng dẫn từng bước về cách tạo ra chúng cho người dùng”.