Article
Từ Chatbot đến AI Agents và Agentic AI: AI bắt đầu “làm việc”
Nhìn lại giai đoạn đầu tiên của thời đại AI. Khi AI từ công cụ hỏi đáp thông thường đến những nhân viên số rồi tới sự tham gia của AI trên môi trường số.

Trong 5 năm qua, AI đã thay đổi đời sống chúng ta như thế nào?
Cuối năm 2022, OpenAI cho ra mắt ChatGPT - chatbot dựa trên model GPT 3.5. Đây có lẽ là một dấu mốc quan trọng của lịch sử công nghệ. ChatGPT khiến mọi chatbot trước trở thành quá ngô nghê và lỗi thời. Chatbot thế hệ mới - Chatbot AI bên trong là một lõi AI với 2 điều căn bản:
- Khả năng hiểu và sử dụng ngôn ngữ của con người chúng ta.
- Dữ liệu được huấn luyện khổng lồ (pre-trained) mà giờ đây gần như đã chạm ngưỡng chứa toàn bộ tri thức bạch hoá của loài người.
Giờ đây chúng ta đã quá quen thuộc với việc sử dụng ChatGPT, Gemini, Claude, Grok, Deepseek, Qwen …. Hỏi chúng, trao đổi với chúng gần như tất cả mọi vấn đề. Vợ tôi mới đây dùng ChatGPT để thảo luận về phim Inception, trong khi tôi sử dụng chúng như các đối tác tư duy và trợ lý đắc lực. Không hiếm các chia sẻ về việc mọi người sử dụng các Chatbot này để trao đổi cả các vấn đề riêng tư.

Ảnh: AI bước vào đời sống của con người thông qua dạng Chatbot - ảnh tạo bởi Gemini
Dù lợi hay hại như thế nào, thì điều đó cho thấy, các AI - dưới giao diện ChatBot đã tham gia và trở thành một phần đời sống của chúng ta, như cách Google Search đã làm.
”Sẽ có một thế hệ tin AI hơn con người” — đây là điều tôi nói với một anh bạn “giáo sư” một học viện đào tạo.
AI Agents, khi AI bắt đầu có thể “làm việc”.
Từ những đoạn trả lời ngô nghê của năm 2022, các AI tiến hoá với tốc độ đáng kinh ngạc, ngày càng thể hiện khả năng thông minh cùng hiểu biết sâu sắc hơn. Chúng ta cũng bắt đầu hỏi chúng nhiều hơn phục vụ cho công việc, các marketer dùng chúng để lập kế hoạch, các lập trình viên hỏi chúng các đoạn mã và thuật toán….
Nhưng chúng ta mong muốn nhiều hơn thế, nếu chỉ dừng ở việc hỏi đáp, chúng chỉ giống như đám cố vấn chỉ chỏ từ xa, thậm chí còn chẳng đủ thông tin bối cảnh để có thể đưa ra lời khuyên chính xác. Sẽ thế nào nếu các mô hình AI có thể thực hiện được các công việc trên môi trường số? Và chúng ta bước vào giai đoạn AI Agents. Khi AI bắt đầu chuyển dịch từ một cỗ máy có khả năng “hiểu và tạo ra văn bản” sang việc máy móc “suy luận, lập kế hoạch và hành động”.
AI Agents là gì?
Hiểu một cách đơn giản. AI Agent là một bộ não AI (thường là mô hình ngôn ngữ lớn - LLM) được cung cấp bối cảnh/tri thức trong một phạm vi công việc với các công cụ (tools) để thực hiện.
AI Agents = LLM + context + tools
- LLM: một mô hình AI. Đó có thể là GPT, Claude, Gemini, Qwen…
- Context: các thông tin về bối cảnh của nhiệm vụ như thông tin, các nguyên tắc, tình trạng của dự án. Đó cũng có thể là tri thức, kỹ năng mà agent cần để hoàn thành công việc.
- Tools: các công cụ mà agent có thể truy cập, ví dụ như tạo file, tìm kiếm trên mạng, xử lý hình ảnh hay chuyên biệt trong công ty như khả năng đọc dữ liệu nội bộ, tạo đơn hàng, nhắn tin nhắc việc cho nhân viên ….

Liên tưởng tới chiếc máy tính. LLM giống như bộ vi xử lý trung tâm, CPU, còn context là các dữ liệu lưu trữ trong máy và tools là bàn phím, màn hình, v.v… Riêng chiếc CPU, AI không thể tạo ra một chiếc máy tính hoàn chỉnh giúp bạn hoàn thành công việc. Hoặc tưởng tượng một chiếc robot lau nhà (ồ dùng từ robot với chiếc máy này giờ thật xa xỉ). Chú robot này cần một CPU để xử lý (tương ứng là LLM), bản đồ căn hộ của bạn chính là context và chổi, quạt hút, khăn lau … chính là tools.
Vậy các AI Agents có thể làm được gì?
Tôi hay nói câu: “trần sao âm vậy” như một cách dễ hiểu cho tư duy tương đồng (Analogical Thinking) khi nói với mọi người về AI. Tức nếu chúng ta hoàn toàn có thể tư duy đối xử với chúng như con người. Hãy tưởng tượng bạn có những nhân sự, trợ lý, chỉ khác họ tồn tại trên môi trường số. Như vậy các AI agents hoàn toàn có thể làm mọi việc trên môi trường số - nếu bạn cung cấp cho chúng đủ context và trang bị đầy đủ công cụ. Nếu bạn là một quản lý, bạn tiếp nhận một nhân sự mới, điều bạn làm đầu tiên là chỉ cho họ cách làm việc, hướng dẫn họ thực hiện, nếu có tài liệu quy trình, quy định bạn sẽ gửi cho họ đọc, bạn đang cung cấp context. Bạn cung cấp cho họ máy tính, máy móc, cùng quyền sử dụng - tools.
Có 2 cách tôi áp dụng để xây dựng AI agent
Trợ lý ảo
Đây là cách tiếp cận phổ biến nhất, hoặc có thể chúng ta được truyền cảm hứng từ phim ảnh với Jarvis của Iron Man, Joi của Blade Runner, Samantha trong Her …. Khi AI giúp chúng ta các công việc cá nhân như đặt lịch, nhắc việc, tổng hợp tin tức, email hay thậm chí cả theo dõi thị trường chứng khoán v.v… Bất cứ thứ gì mà con người muốn có thể uỷ quyền để nhàn hạ hơn.
Bản thân tôi cũng tạo ra một trợ lý ảo tên T, giúp tôi quản lý công việc, đặt lịch, kiểm tra các email mới, mỗi đầu ngày gửi cho tôi một lời chúc kèm thi kệ của Thiền Sư Thích Nhất Hạnh.

Ảnh: Đa số mọi người khi nghĩ xây dựng AI cá nhân đều nghĩ đến trợ lý ảo, ảnh tạo bởi Gemini.
Nhân viên số
Phức tạp hơn là nhân viên số, khi AI tham gia vào công ty như một vị trí công việc để thực thi các tác vụ phức tạp ở mức độ tự động hoá cao hơn so với các chương trình phần mềm. Khi đó có thể sẽ cần nhiều hơn một ai agents tham gia để xử lý công việc, tôi gọi chúng là “hệ ai agents”.

Ảnh: Hệ thống mà tôi đang xây dựng, bên cạnh giao công việc cho một người, có thể giao cho các agents
Điều này gần như đã rõ ràng trong môi trường phát triển phần mềm, khi các ai agents tham gia từ khâu phân tích, viết mã, kiểm thử và đến cả bước phát hành.
Hãy tưởng tượng: một quản lý đơn vị bán hàng thường xuyên phải theo dõi tốc độ bán, so sánh với định mức tồn kho để ra quyết định nhập hàng bổ sung. Để thực hiện việc này anh ta sẽ phải thực hiện các thao tác: kiểm tra báo cáo bán, kiểm tra hàng tồn kho và định mức tồn, quyết định nhập, tạo đơn nhập, liên hệ nhà cung cấp, theo dõi đơn, nhận hàng vào kho và kết thúc đơn nhập, cuối cùng là bổ sung danh mục bán. Giả sử anh ta có các agent A phụ trách hệ thống bán hàng, agent B là thông tin kho, agent C là đơn đặt hàng nhà cung cấp.
- Agent A có thể chủ động theo dõi tiến độ bán hàng, tổng hợp báo cáo gửi người quản lý.
- Quản lý thấy tốc độ bán một số mặt hàng tăng nhanh, anh ta sẽ hỏi Agent B về tồn kho. Agent B dựa vào định mức đưa ra số liệu gợi ý
- Quản lý thấy một số mặt hàng cần phải nhập bổ sung, anh ta yêu cầu agent C tạo đơn đặt hàng. Tuỳ khả năng được cung cấp, agent C có thể gửi email, tin nhắn tới nhà cung cấp về đơn đặt hàng dự kiến. Nếu có đủ công cụ và uỷ nhiệm, nó hoàn toàn có thể tự động cập nhật trạng thái đơn hàng theo email phản hồi của nhà cung cấp hay theo dõi lộ trình đơn.
- Khi đơn hàng được nhân viên kho xử lý, agent B có thể gửi thông tin đến quản lý về việc các mặt hàng này sẵn sàng bán tiếp….
Với các AI agents, con người chuyển dịch dần từ vị trí thực thi sang giám sát và ra quyết định. Tuy nhiên đây không còn là điều mới mẻ nữa.

Ảnh: giao việc tạo sản phẩm cho agent quản lý danh mục sản phẩm, agent này thực thi trong chưa đầy 30s trong hệ thống mà tôi đang xây dựng. Bản thân hệ thống này cũng được phát triển bởi AI.
Từ các tác nhân đơn lẻ đến sự phối hợp tự chủ giữa các tác nhân - Agentic AI
Nếu như năm 2025 là năm của AI agents, thì năm 2026 chúng ta sẽ chứng kiến Agentic AI. Trong ví dụ trên, các ai agent hoạt động độc lập trong một phạm vi cụ thể. Người quản lý vẫn là người phải điều phối, giao việc và giám sát các agent thực thi với vai trò tiên quyết. Anh ta giao việc này cho agent A, hay gọi agent B thực hiện một việc tiếp theo sau khi agent C xong việc… Agentic AI - một khái niệm - là hệ sinh thái các AI agents mà trong đó chúng tự tổ chức, lập kế hoạch, thực thi, và quan trọng - giám sát kết quả, lặp lại việc thực thi cho tới khi đạt được yêu cầu của con người.
Điều này không phải là tưởng tượng nữa, ngay trong lĩnh vực của mình tôi đã có sự xuất hiện các Agentic OS (hoặc framework) cho phép các agent tương tác qua lại. Tôi từng thấy một người share một ảnh các agents của anh ta tranh luận về yêu cầu trong lúc chúng đang lập kế hoạch. Hay bản thân tôi đã trải nghiệm - dù chưa hoàn toàn - các agent của mình tranh luận trong phiên brainstorm, chúng còn giả lập như một buổi họp mà nếu gắn thêm công cụ text to speech thì tôi có thể thoái mái nói chuyện và nghe mỗi agent một giọng nói khác nhau. Bản thân các nền tảng cũng phát triển các mô hình của mình theo hướng trở thành agentic OS. Nâng cấp gần đây của Codex (một mô hình cho việc lập trình của OpenAI) hay Claude đều đã có cơ chế sản sinh ra các agents, lập kế hoạch và mỗi agent tự claim công việc của nó và liên lạc với nhau qua hòm mail (mailbox) mà không khỏi bất ngờ (hoặc hào hứng) khi đọc cách chúng thảo luận và thông tin cho nhau.
Hiện tại tôi cũng đang áp dụng điều này vào hệ thống mình đang xây dựng.

Ảnh: Khi AI không chỉ đơn thuần nhận mệnh lệnh đơn lẻ từ con người mà chúng còn tự biết cộng tác, điều phối và đánh giá kết quả. Ảnh tạo bởi Gemini
Có lẽ đọc đến đây, nhiều bạn sẽ tự hỏi, vậy thì chúng ta sẽ làm gì? Với AI agents, chúng ta còn xác định được vai trò của mình là quản lý, vậy với agentic AI thì sao? Tôi chưa có câu trả lời, có lẽ thế giới sẽ tiến tới Utopia, với tuần làm việc 3h như Rutger Bregman dự đoán; “lần đầu tiên trong lịch sử làm việc trở thành thú vui chứ không phải yêu cầu bắt buộc” – Elon Must, hoặc làm việc quần quật hơn để cạnh tranh với AI, để không rơi vào Giai cấp vô dụng (Yuval Noah Harari). Chúng ta có thể trở thành những con người mập mạp với robot vây quanh trong Wall-E hoặc sẽ bước vào cuộc đấu tranh giành giật sự tồn tại trong The Matrix… Đùa thôi, dù sao thì cũng là một tương lai vô tiền khoáng hậu trong lịch sử loài người khiến tôi không thể không hào hứng.
P/S: bài viết trên hoàn toàn dựa vào kiến thức và kinh nghiệm cá nhân. Tôi rất mong nhận được đóng góp của các bạn nếu có chỗ nào tôi còn thiếu xót hoặc chưa hiểu đầy đủ.





