Tokenmaxxing

Đầu tháng 4/2026, một bảng xếp hạng nội bộ của Meta bị rò rỉ ra ngoài với tên gọi “Claudeonomics” — xếp hạng nhân viên theo lượng token AI tiêu thụ mỗi tháng. Người dùng nhiều nhất được gắn danh hiệu “Token Legend” với con số kỷ lục: 281 tỷ token/30 ngày. Để dễ hình dung, lượng token đó đủ để soạn khoảng 800 triệu email/tháng.

Token maxing là gì?

“Tokenmaxxing” — suffix “-maxxing” mượn từ Gen Z slang, tương tự “looksmaxxing” hay “sleepmaxxing,” nghĩa là tối đa hóa một thứ gì đó. Trong trường hợp này, là lượng token AI tiêu thụ.

Theo Py, có thể hiểu token maxing theo hai hướng. Hướng thứ nhất là bắt AI làm việc càng nhiều càng tốt, chạy tự động workflow, liên tục học và improve…. Còn hướng thứ hai là cố gắng dùng AI cho mọi thứ, đốt càng nhiều token càng tốt cho đến khi chạm đến limit thì rơi vào trạng thái không biết làm gì tiếp theo. Hướng 1 chắc chắn là mong muốn của mọi người dùng, nhưng hướng 2 lại là cái bẫy không phải ai cũng có thể nhận ra.

Càng nhiều công cụ AI ra đời, việc sử dụng càng dễ dàng, thì cái bẫy dopamine này lại càng được ngụy trang khéo léo. Cứ mỗi lượt prompt thành công, AI trả ra chữ chạy đều đều trên màn hình lại mang đến cảm giác mình đang làm việc. Nhưng ranh giới giữa “cảm giác đang tạo ra giá trị” và “giá trị thực tế” (impact) lúc này đã bị xóa nhòa.

Joe Reis — tác giả và nhà nghiên cứu về data engineering — gọi thẳng hiện tượng này là “productivity theater” (vở kịch năng suất). Ông và Tristan Handy (CEO của dbt Labs) đồng ý với nhau rằng: một năm nữa nhìn lại, có thể họ sẽ tự hỏi rốt cuộc mình đã làm được gì. Hình ảnh Joe Reis dùng khá đắt: chúng ta tưởng mình đang chạy rất nhanh, nhưng thực ra chỉ đang xoay vòng trên một cái bánh xe hamster (hamster wheel).¹

Nhóm OutSight AI thậm chí còn cực đoan hơn khi cho rằng: giả định “năng suất tăng tỷ lệ thuận với lượng token tiêu thụ” là một tư duy lười biếng. Những thứ thực sự cốt lõi để tạo ra giá trị — như năng lực phán đoán, khả năng phối hợp hay chất lượng của một quyết định — vốn dĩ chưa bao giờ được đo bằng số lượng token.²

Viết trên Medium vào tháng 4/2026, Ellen Mahloy gọi đây là Hiệu ứng Hawthorne (Hawthorne Effect) của thời đại AI. Khi việc “dùng AI nhiều hay ít” vô tình trở thành một thước đo hiệu quả, người ta sẽ có xu hướng tối ưu hóa chính cái thước đo đó, thay vì tập trung vào kết quả (outcome) thực tế. AI usage thì quá dễ để đong đếm. Còn năng suất thực sự thì không.³

Vòng đi vòng lại, vấn đề không phải là token nhiều hay ít. Mà là token đó đang làm gì, và output đó đi về đâu.

Phần “lãi” mà token count không đo được

Joe Reis kể rằng trong chuyến đi San Francisco gần đây, ông cố tình không mang laptop — chỉ có một chiếc máy tính bảng ghi chú, điện thoại, và một cuốn sách bìa cứng. Ông gọi đó là “siêu năng lực.” Với ông, những công việc thực sự có giá trị cần thời gian suy nghĩ sâu — không phải cứ liên tục bắn prompt rồi nhận kết quả. Ông hoàn toàn có thể dùng Claude để ra một cuốn sách trong vài tuần. Nhưng ông không làm vậy — vì thế giới không cần thêm một cuốn sách được tạo ra cho có.

Với Py, phần lãi thực sự của việc dùng AI đúng cách không phải là làm được nhiều thứ hơn. Mà là có thêm thời gian và năng lượng để làm những thứ chỉ mình mới làm được — những quyết định cần đến kinh nghiệm, những kết nối chỉ xuất hiện khi bạn thực sự suy nghĩ, những thứ mang dấu ấn của người tạo ra nó.

Cách làm của Py là liên tục hỏi bản thân “for what?”. Thành thật mà nói, khi AI được tích hợp sâu hơn trong quá trình làm việc, ở vị trí của PO, Py biết mình không thể “say no” hay thậm chí “say hold” với những request chưa đủ dữ kiện chứng minh impact, nên cứ để mình bị cuốn theo dòng delivery càng nhanh càng nhiều càng tốt. Cho đến khi phải trả product debt — những rule, những feature phục vụ request ngắn hạn nhưng đòi hỏi lượng lớn công sức maintain về sau, chưa kể tech debt — Py mới đủ tự tin hơn ở luận điểm không phải cứ làm nhiều là tốt. Dù vẫn không thể thoát khỏi sức nặng của cái được gọi là “corporate slave,” nhưng chí ít, trong một chừng mực có thể, Py vẫn đang giữ được triết lý làm nghề của mình — làm gì đó có ý nghĩa.

Ngoảnh đi ngoảnh lại, AI cũng chỉ là một tấm gương phản chiếu chính bộ não của người dùng. Nếu bạn bước vào với một tư duy mơ hồ, AI sẽ cho bạn một sự bận rộn mơ hồ nhưng khổng lồ ở quy mô hàng tỷ token. Ngược lại, nếu bạn biết rõ cốt lõi vấn đề nằm ở đâu, một vài dòng prompt ngắn ngủi là đủ để kích hoạt một đòn bẩy hiệu suất thực sự. Garbage in, garbage out.

Trở lại với context cá nhân — giữa một thế giới đang cuồng nhiệt chạy đua bằng số lượng token tiêu thụ, Py cho phép mình dừng lại và hỏi: “For what?” Dù vẫn là một “corporate slave” chạy theo deadline của tổ chức, ít nhất Py sẽ không để mình trở thành con hamster chạy điên cuồng trên cái vòng xoay năng suất ảo.

¹ Joe Reis, “Why Tokenmaxxing is For Fools. A Rant on Fake Productivity.”, Substack, tháng 5/2026. Link

² OutSight AI, “Productivity Delusion: Token Maxing Won’t Save You”, Medium, tháng 4/2026. Link

³ Ellen Mahloy, “Token Maxing: When AI Metrics Incentivize the Wrong Work”, Medium, tháng 4/2026. Link

Cám ơn bạn đã nán lại cho đến những dòng cuối cùng này.

Chúc bạn nhiều may mắn và bình an.

Anpy

Comments

Leave a Reply Cancel reply