Tại sao Agent AI của bạn lại bị "mù" thời gian?

Một sự cố nhỏ khi xây dựng đội hình golf đã hé lộ lỗ hổng lớn trong hạ tầng AI: các Agent hiện nay không có khái niệm về thời gian thực. Bài viết này phân tích vấn đề "mù thời gian" và giới thiệu Sensa - thư viện mã nguồn mở giúp AI có nhận thức môi trường xung quanh.

Tôi đang sử dụng AI agent để xây dựng đội hình DraftKings thì nó thông báo rằng hôm nay là thứ Hai. Nhưng thực tế là thứ Ba.

Đây là câu chuyện về một lỗi giá 0 đô la nhưng đã hé lộ một khoảng trống trị giá hàng tỷ đô la trong hạ tầng AI.

Đó là tuần giải Masters. Tôi đã để AI agent của mình — Hermes, chạy trong một phiên hoạt động dài — giúp tôi xây dựng đội hình golf tối ưu cho DraftKings. Chúng tôi đã qua lại một hồi: kéo số liệu thống kê của người chơi, phân tích lịch sử sân đấu tại Augusta, tối ưu hóa việc phân bổ giới hạn lương.

Sau đó, tôi yêu cầu nó tính toán các cập nhật buổi chiều. Nó tự tin khẳng định rằng hôm nay là thứ Hai, ngày 6 tháng 4. Vòng tập luyện. Không cần vội.

Nhưng thực tế là thứ Ba, ngày 7 tháng 4. Các cặp đấu đã được công bố, thêm nhiều golfer vào danh sách lựa chọn.

Agent không bị "ảo giác" theo nghĩa truyền thống. Nó không bịa ra sự kiện về golf. Nó chỉ nhận được một dấu thời gian khi phiên bắt đầu — vào thứ Hai — và đã dựa vào khoảnh khắc đóng băng duy nhất đó kể từ đó. Giờ trôi qua, ngày thay đổi, và agent hoàn toàn mù tịt.

Tôi không mất tiền. Nhưng tôi hoàn toàn có thể đã mất. Và sự cố suýt xảy ra đó đã khiến tôi đi sâu vào vấn đề, culminating việc xây dựng một thư viện mã nguồn mở — bởi vì vấn đề này không chỉ nằm ở agent của tôi. Nó nằm ở mọi agent.

Vấn đề: Mù thời gian (Temporal Blindness)

Đây là điều mà hầu hết những người xây dựng sản phẩm với LLM không nghĩ đến cho đến khi nó gây rắc rối: agent của bạn không biết hiện tại là mấy giờ.

Không thực sự. Không phải theo bất kỳ ý nghĩa có ý nghĩa và liên tục nào.

Khi bạn bắt đầu một phiên với Claude, GPT-4, hoặc bất kỳ mô hình nào khác, hệ thống thường bao gồm một dấu thời gian. Ví dụ như: Ngày hiện tại là thứ Hai, ngày 6 tháng 4 năm 2026. Dấu thời gian đó được thiết lập một lần. Nó không bao giờ cập nhật. Nếu phiên của bạn kéo dài 6 giờ, hoặc bạn tiếp tục cuộc hội thoại vào ngày hôm sau, mô hình vẫn nghĩ đó là sáng thứ Hai.

Đây không phải là lỗi của bất kỳ mô hình đơn lẻ nào. Đó là thuộc tính cấu trúc của cách LLM hoạt động. Chúng là công cụ hoàn thành văn bản không trạng thái (stateless). Chúng không trải nghiệm sự trôi chảy của thời gian. Chúng xử lý một cửa sổ ngữ cảnh và tạo ra phản hồi. "Thời gian hiện tại" chỉ là một chuỗi khác trong prompt — và nếu không ai cập nhật chuỗi đó, nó sẽ lỗi thời.

Ngay cả những agent có quyền truy cập công cụ cũng không giải quyết được vấn đề này. Hãy cung cấp cho agent công cụ tìm kiếm web, API thời tiết, tích hợp lịch. Nó vẫn sẽ không tự phát kiểm tra thời gian. Các công cụ mang tính phản ứng — agent phải quyết định sử dụng chúng. Nếu agent tin rằng hôm nay là thứ Hai (vì prompt nói vậy), tại sao nó lại nghi ngờ điều đó? Nó không cảm thấy sự nghi ngờ. Không có chiếc đồng hồ nội bộ nào tích tắc, tạo ra sự bất hòa nhận thức.

Tôi gọi đây là sự trôi ngữ cảnh (context drift) — sự phân kỳ thầm lặng giữa những gì agent tin về thế giới và những gì thực sự đúng. Đó không phải là ảo giác (tạo ra thông tin sai). Đó là thứ tinh tế hơn và có lẽ nguy hiểm hơn: vận hành dựa trên sự thật cũ kỹ với sự tự tin tuyệt đối.

Ngành công nghiệp đang xử lý vấn đề này như thế nào (hoặc không xử lý)

Hệ sinh thái hạ tầng AI đang bùng nổ. Hàng tỷ đô la vốn đầu tư. Hàng trăm startup. Và yet, gần như không ai đang làm việc trên vấn đề cụ thể này. Đây là bối cảnh như tôi thấy:

Nhóm 1: Cửa sổ ngữ cảnh lớn hơn. Google's Gemini hiện hỗ trợ 2 triệu token. Anthropic liên tục mở rộng cửa sổ của Claude. Lý thuyết là: nhét nhiều thông tin hơn vào, và mô hình sẽ tự hiểu. Nhưng cửa sổ lớn hơn không giải quyết được tính mới mẻ. Bạn có thể nhét cả một bách khoa toàn thư vào ngữ cảnh nhưng mô hình vẫn không biết trời đang mưa bên ngoài.

Nhóm 2: Sử dụng công cụ và gọi hàm. MCP (Giao thức Ngữ cảnh Mô hình), gọi hàm OpenAI, các khung công cụ sử dụng tool — những thứ này cho phép agent thực hiện việc. Tìm kiếm web. Gọi API. Kiểm tra thời tiết. Nhưng về cơ bản chúng mang tính phản ứng. Agent phải quyết định vươn tay lấy công cụ. Nếu ngữ cảnh hiện tại của nó cảm thấy đủ đầy (ngay cả khi đã cũ), nó sẽ không làm vậy. Bạn đang dựa vào mô hình để biết những gì nó không biết — chính là kỹ năng siêu nhận thức mà LLM thiếu.

Các công ty bộ nhớ như Mem0, Zep và Letta đang xây dựng các lớp lưu trữ — cho phép agent nhớ các cuộc hội thoại trong quá khứ và sở thích của người dùng. Đây là công việc có giá trị, nhưng nó nhìn về quá khứ. Bộ nhớ cho bạn biết điều gì đã là. Nó không cho biết điều gì đang là.

Các nền tảng công cụ như Composio và Toolhouse tổng hợp API và cho phép agent khả năng thực hiện hành động. Cũng có giá trị. Nhưng một lần nữa, hướng tới hành động, không phải môi trường xung quanh. Chúng là tay và chân, không phải giác quan.

Khoảng trống: Không ai đang xây dựng lớp nhận thức (perception layer) — sự nhận thức môi trường, luôn cập nhật nằm giữa bộ nhớ (quá khứ) và công cụ (hành động). Thứ nói với agent, mà không cần được hỏi, rằng "bây giờ là 5 giờ chiều thứ Ba, trời 74°F và nắng đẹp, Bitcoin vừa di chuyển 2%, và đây là những gì đang diễn ra trên tin tức".

Con người có điều này. Chúng ta liếc nhìn đồng hồ, cảm nhận thời tiết, nghe lén các tiêu đề. Đó không phải là điều chúng ta quyết định làm một cách có ý thức — nó là môi trường. Agent của chúng ta cần thứ tương tự.

Giới thiệu Sensa

Sensa là một thư viện Python nhẹ nhàng cung cấp cho AI agent nhận thức môi trường thế giới. Một cuộc gọi hàm. Ngữ cảnh mới mẻ. Mỗi lần.

pip install sensa

from sensa import get_context

context = get_context()
print(context)

Đầu ra:

[SENSA — Tue Apr 7, 2026 5:00 PM CDT] ⏱ Session: <1m | Last call: <1m 🌤 Austin, TX: 74°F, sunny, wind 9mph 📈 BTC: $69,905 (+0.6%) | ETH: $2,145 (+0.2%) | SOL: $82.90 (+1.7%) 📰 Iranians form human chains... | Wireless Festival cancelled...

Đó là tất cả. Khối văn bản đó — khoảng 87 token — cung cấp cho agent của bạn một bức ảnh chụp nhanh thời gian thực của thế giới. Tiêm nó vào bất kỳ hệ thống prompt nào, và agent đột nhiên biết được:

Khi nào (ngày, giờ, múi giờ, thời lượng phiên, thời gian kể từ lần tương tác cuối)
Thời tiết thế nào (nhiệt độ, điều kiện, gió — định vị vị trí tự động)
Thị trường đang diễn ra gì (BTC, ETH, SOL với giá và thay đổi 24h)
Đang có chuyện gì (các tiêu đề hàng đầu, được nén)

Bốn kênh. Tất cả đều tùy chọn. Tất cả đều có thể cấu hình. Không cần khóa API cho việc sử dụng cơ bản.

Việc theo dõi phiên đặc biệt hữu ích. Dòng Session: <1m | Last call: <1m cho agent biết liệu nó đang trong một cuộc hội thoại nhanh hay người dùng đã biến mất 3 giờ và vừa quay lại. Đó là ngữ cảnh thay đổi cơ bản cách agent nên phản hồi.

Mẫu tích hợp

Mẫu 1: Tiêm cơ bản (5 dòng)

from sensa import get_context

def build_system_prompt():
    base = "Bạn là một trợ lý hữu ích."
    world = get_context()
    return f"{base}\n\n{world}"

Mẫu 2: System prompts của OpenAI / Anthropic

from openai import OpenAI
from sensa import get_context

client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4",
    messages=[
        {
            "role": "system",
            "content": f"Bạn là một trợ lý hữu ích.\n\n{get_context()}"
        },
        {
            "role": "user",
            "content": "Tôi có nên đi chạy bộ ngay bây giờ không?"
        }
    ]
)

Mô hình giờ biết trời 74°F và nắng đẹp — nó thực sự có thể trả lời câu hỏi này.

Mẫu 3: Kênh tùy chỉnh

from sensa import Sensa, Channel

class PortfolioChannel(Channel):
    name = "portfolio"
    default_enabled = True

    def render(self, config):
        # Kéo từ nguồn dữ liệu của riêng bạn
        positions = get_my_positions()
        total = sum(p.value for p in positions)
        return f"💼 Portfolio: ${total:,.0f} | {len(positions)} positions"

sensa = Sensa(channels=["time", "weather", PortfolioChannel()])
context = sensa.get_context()

Hệ thống kênh được thiết kế để mở rộng. Mỗi kênh là một đơn vị tự chứa biết cách lấy và hiển thị một lát cắt của trạng thái thế giới. Kết hợp chúng theo cách bạn muốn.

Triết lý thiết kế

Một vài lựa chọn có chủ đích đáng được nhắc đến:

Hiệu quả token quan trọng. Khi bạn tiêm ngữ cảnh vào mỗi cuộc gọi API, mỗi token đều đáng giá. Đầu ra đầy đủ của Sensa là ~87 token. Ít hơn hầu hết các system prompt. Chúng tôi ám ảnh về sự nén — viết tắt, ký hiệu, mật độ thông tin — để bạn nhận được sự nhận thức tối đa trên mỗi token.

Cấu hình bằng 0 theo mặc định, kiểm soát đầy đủ khi bạn muốn. get_context() hoạt động ngay lập tức. Nhưng bạn có thể cấu hình kênh, đặt vị trí thủ công, chọn tiền điện tử để theo dõi, đặt ngưỡng lỗi thời, tất cả mọi thứ.

Môi trường, không phản ứng. Sensa không phải là công cụ mà agent gọi. Đó là ngữ cảnh mà agent luôn có. Đây là sự khác biệt triết lý chính. Bạn không muốn agent của mình quyết định kiểm tra thời gian. Bạn muốn nó đã biết rồi.

Mã nguồn mở, cấp phép MIT. Đây là hạ tầng. Nó nên miễn phí và có thể phân nhánh (forkable).

Bức tranh lớn hơn

Chúng ta đang ở những ngày đầu của một sự thay đổi lớn. AI agent đang chuyển từ chatbot sang các hệ thống tự trị quản lý tiền, lên lịch phẫu thuật, kiểm soát hạ tầng và đưa ra quyết định trong thế giới thực. Các rủi ro đang tăng theo cấp số nhân.

Và ngay lúc này, hầu hết các agent này không biết hôm nay là ngày nào.

Đó không phải là một hạn chế dễ thương. Đó là sự thất bại cấu trúc trong stack. Hệ thống bộ nhớ, khung công cụ, bài kiểm tra đánh giá — tất cả đều quan trọng, đều được cấp vốn và xây dựng. Nhưng lớp nhận thức — sự nhận thức môi trường, thời gian thực của khoảnh khắc hiện tại — đã bị bỏ qua.

Sensa là một thư viện nhỏ giải quyết một phần của vấn đề này. Nhưng ý tưởng lớn hơn bất kỳ gói phần mềm đơn lẻ nào: agent cần giác quan, không chỉ là kỹ năng.

Bắt đầu ngay

pip install sensa

GitHub: github.com/terrapin88/sensa

Hãy sao star repo. Mở issue. Hãy cho chúng tôi biết bạn muốn kênh nào. Xây dựng kênh của riêng bạn và đóng góp lại.

Nếu bạn từng gặp rắc rối vì một agent không biết thời gian, thời tiết, hoặc những gì đang diễn ra trên thế giới — bạn hiểu tại sao điều này quan trọng.

Agent của bạn xứng đáng biết những gì đang diễn ra ngay lúc này.

Sensa là mã nguồn mở và được cấp phép MIT. Được xây dựng ở một nơi hẻo lánh vào một thứ Ba mà agent của tôi tưởng là thứ Hai.

Tại sao Agent AI của bạn lại bị "mù" thời gian?

Vấn đề: Mù thời gian (Temporal Blindness)

Ngành công nghiệp đang xử lý vấn đề này như thế nào (hoặc không xử lý)

Giới thiệu Sensa

Mẫu tích hợp

Triết lý thiết kế

Bức tranh lớn hơn

Bài viết liên quan