JPMorgan Chase vừa cho phép quản lý sử dụng trí tuệ nhân tạo để hỗ trợ viết đánh giá nhân sự hàng năm, một trong những nhiệm vụ thường niên khiến các sếp ngán ngẩm nhất. Tuy nhiên, quyết định này cũng làm dấy lên câu hỏi: Liệu đánh giá do AI viết có thực sự cải thiện quá trình phản hồi, hay chỉ khiến mọi thứ trở nên tồi tệ hơn, đặc biệt với những nhân viên mong muốn nhận được lời góp ý chất lượng?
Theo các lãnh đạo doanh nghiệp và chuyên gia quản trị, việc đưa AI vào quy trình đánh giá thường niên có thể giúp cấp quản lý tiết kiệm thời gian, thậm chí mang lại phản hồi hữu ích hơn so với việc chỉ dựa vào con người. Tuy nhiên, họ cảnh báo rằng nếu phụ thuộc quá nhiều vào công nghệ, các bản đánh giá sẽ trở nên máy móc và thiếu chiều sâu. Trên thực tế, nhiều nhà quản lý đã âm thầm sử dụng AI dù chưa được cho phép, vì mỗi người tự đặt ra quy tắc riêng.
“Việc áp dụng công nghệ mới sẽ vẽ lại các làn ranh trong lĩnh vực quản trị,” Benjamin Levick, giám đốc phụ trách AI và vận hành tại công ty thẻ doanh nghiệp Ramp, nhận định. “Tôi chưa rõ điều đó sẽ khiến mọi người cảm thấy thiếu tự nhiên hay gượng gạo đến mức nào. Nguy cơ đó chắc chắn tồn tại nếu AI bị sử dụng một cách cứng nhắc, nhưng tôi tin là có thể tìm ra cách để kết hợp công nghệ này một cách hợp lý vào công tác quản lý.”
Hướng dẫn mới của JPMorgan cho phép các cấp trên sử dụng chatbot nội bộ để soạn thảo đánh giá, nhưng nhấn mạnh rằng công nghệ “không thể thay thế cho phán đoán của con người.” Ngân hàng cũng nghiêm cấm việc dùng AI để chấm điểm hiệu suất, đưa ra quyết định về lương hoặc đề bạt.
Theo Levick, nếu người quản lý không tận dụng công cụ sẵn có để đánh giá toàn diện công việc của nhân viên, họ có thể vô tình gây bất lợi cho chính cấp dưới. Ông nói: “Tôi sẽ rất thất vọng nếu một con AI tự động đọc tất cả những gì tôi viết, xem mọi thứ tôi làm, rồi tự chấm điểm và sếp tôi chỉ đọc lại bản kết luận đó. Đó là cách làm sai. Nhưng tôi cũng sẽ không vui nếu sếp tôi chỉ có vài tiếng để làm đánh giá, phải lọc thủ công từng thông tin một, rồi viết đánh giá dựa trên chưa tới 2% công việc tôi đã làm trong cả năm.”
Peter Cappelli, giáo sư quản trị tại Đại học Pennsylvania và giám đốc Trung tâm Nhân sự của trường Wharton, cho biết người quản lý, cũng như mọi con người khác, đều có xu hướng thiên vị và dễ nhớ sai. Họ thường đánh giá quá cao các sự kiện diễn ra gần đây khi xem xét cả quá trình dài. Theo ông, AI đôi khi lại đưa ra nhận định khách quan hơn.
Tuy nhiên, Cappelli cho rằng nhân viên có thể xem nhẹ bản đánh giá nếu biết có sự can thiệp của AI. “Họ có thể tự nhủ, tôi không tin vào nhận xét này vì nó không đến từ sếp tôi,” ông nói. “Ví dụ như lời khen, làm sao tôi biết liệu sếp tôi có thật sự nghĩ vậy không?”
Nhiều nghiên cứu cho thấy khi được cung cấp công cụ AI, con người thường phó mặc quá trình phân tích cho công nghệ và ít tự suy xét hơn. Điều này có thể mang lại lợi ích, nhưng cũng tiềm ẩn nhiều rủi ro khi áp dụng vào đánh giá nhân sự. Cappelli cảnh báo rằng nhân viên có thể cảm thấy mình đang bị “xử lý theo quy trình” thay vì được đánh giá thật sự, và điều đó chỉ làm họ càng thêm hoài nghi về một quy trình vốn đã bị xem là hình thức. Ngoài ra, chatbot thường có xu hướng tâng bốc, khiến bản đánh giá quá tích cực và không chỉ ra được điểm cần cải thiện. Đây cũng là lý do vì sao mọi nội dung do AI tạo ra cần được kiểm tra lại về tính công bằng, giọng điệu và độ chính xác.
Với nhiều điểm lợi và bất cập như vậy, cùng với việc công nghệ còn quá mới, các doanh nghiệp sẽ còn phải cân nhắc kỹ trong mùa đánh giá này và cả về sau. Một số công ty như hãng tư vấn KPMG hay nền tảng thương mại điện tử Shopify hiện đã đưa tiêu chí sử dụng AI vào đánh giá nhân sự, nên quyết định dùng công cụ AI có thể sẽ rõ ràng hơn trong những trường hợp đó.
Ở vai trò của mình, Levick cho biết ông vẫn chịu trách nhiệm chính về nội dung đánh giá, nhưng sử dụng AI để tổng hợp dữ liệu như phản hồi từ đồng nghiệp hay kết quả công việc mà nhân viên đã nộp trong năm. “Tôi dùng AI trong mọi bước, nhưng cuối cùng bài đánh giá vẫn đến từ tôi, với góc nhìn của tôi là yếu tố quyết định,” ông nói.
Một số công ty khác đang thử nghiệm những công cụ có vai trò lớn hơn trong quy trình đánh giá. Ví dụ, nền tảng quản lý nhân sự Rippling đang cung cấp hệ thống có tên Talent Signal, chuyên đánh giá 90 ngày làm việc đầu tiên của nhân viên mới. Hệ thống sẽ gán nhãn như “tiềm năng cao,” “trung bình” hoặc “cần chú ý,” dựa trên cách nhân viên xử lý nhiệm vụ, từ trả lời khách hàng đến viết mã, có xét đến độ phức tạp của công việc. Quản lý có thể đồng ý hoặc không với nhận định của hệ thống bằng một nút xác nhận.
Tuy nhiên, một số chuyên gia cảnh báo rằng AI chỉ hữu ích đến một giới hạn nhất định trong việc đánh giá hiệu suất. Nora Jenkins Townson, nhà sáng lập Bright + Early, đơn vị cung cấp dịch vụ nhân sự cho các công ty công nghệ, cho biết cô từng nhận được nhiều đề xuất từ các startup khẳng định đã “giải quyết” được bài toán đánh giá hiệu suất bằng cách giảm tải cho quản lý cấp trung và hạn chế thiên vị. Một số phương pháp bao gồm điền bảng chấm điểm hằng tuần hoặc ghi lại nội dung các buổi họp riêng, rồi tổng hợp thành một bản đánh giá cuối năm.
“Muốn các hệ thống đó hoạt động hiệu quả, bạn phải định nghĩa rõ ràng thế nào là thành công, cả ở cấp công ty lẫn từng vị trí công việc,” cô nói. “Bạn vẫn phải dành thời gian suy nghĩ về việc hiệu suất tốt nghĩa là gì đối với bạn.”