Chuyện đọc dữ liệu: Những cái bẫy khiến bạn ngộ nhận "mình đã hiểu!" | Vietcetera
Billboard banner
11 phút trước

Chuyện đọc dữ liệu: Những cái bẫy khiến bạn ngộ nhận "mình đã hiểu!"

"Có số liệu" chưa chắc là bạn đã nắm được ý nghĩa đằng sau chúng. Đâu là các thiên kiến và thói quen cần phá bỏ để tạo một bảng dữ liệu thực sự có giá trị?
Chuyện đọc dữ liệu: Những cái bẫy khiến bạn ngộ nhận "mình đã hiểu!"

Nguồn: Pexels

Ở bài trước, mình đã giới thiệu qua với các bạn 4 cấp độ xử lý dữ liệu với mô hình DIKW, viết tắt của Data – Information – Knowledge – Wisdom. Bài viết này mình sẽ nói sâu hơn về tầng đầu tiên trong mô hình đó: Làm thế nào để tạo ra thông tin có bối cảnh từ dữ liệu thô ban đầu?

Là Head of Product tại một công ty phát triển sản phẩm công nghệ, hàng tuần mình đều có một cuộc họp cập nhật tình hình sản phẩm từ các Agent Owners (cách team mình gọi các quản lý dự án – Product Managers).

Bao nhiêu năm làm việc, mình vẫn luôn gặp trường hợp các bạn chuẩn bị trình bày cực kỳ đầy đủ, với bảng số liệu dày đặc, các chỉ số KPIs được liệt kê chi tiết.

Nhưng đến khi mình hỏi: “Rồi, vậy kết luận của em về các chỉ số này là gì?”

Bạn ấy khựng lại một nhịp, rồi ậm ừ chống chế theo kiểu nghĩ ra được gì ngay lúc đó thì trả lời.

Mình không bất ngờ lắm.

Vì thật ra, rất nhiều người, không chỉ là Junior mới đi làm, mà cả Senior cũng có khi dễ ngộ nhận rằng có dữ liệu trong tay tức là đã hiểu hết câu chuyện. Chúng ta nhìn vào bảng số, thấy có vẻ hợp lý, rồi tự tin gật đầu.

Nhưng cũng giống như việc cầm bản đồ chưa chắc đã biết đường đi, có số liệu cũng chưa chắc bạn đã nắm được ý nghĩa thực sự đằng sau.

Biết thigrave dễ hiểu mới khoacute Nguồn hoangthoughts
Biết thì dễ, hiểu mới khó. | Nguồn: @hoangthoughts

Điều gì khiến bạn “có nhiều dữ liệu” nhưng không đủ thuyết phục?

Dữ liệu, xét cho cùng, chỉ mới là điểm khởi đầu.

Để hiểu sâu hơn, chúng ta cần biết đặt câu hỏi, kết nối bối cảnh, và rút ra được điều đáng kể từ những con số đó.

Trong bài này, mình sẽ cùng bạn nhìn lại: Vì sao nhiều người dễ dừng lại ở tầng dữ liệu mà tưởng rằng mình đã hiểu?

Chúng ta sẽ nói về: những thiên kiến tư duy dễ mắc phải, những thói quen khiến ta lặp lại sai lầm, và một vài gợi ý nhỏ để không bị mắc kẹt ở tầng dữ liệu.

1. Não bộ thích “thấy vừa đủ” để tin rằng mình đã hiểu

Thiên kiến tư duy 1: Thiên kiến xác nhận (confirmation bias)

Bộ não có thiên hướng tự động tìm kiếm những gì ủng hộ cho điều mình đang tin, và lờ đi những dữ liệu “gây rối”. Đây là một hiện tượng tâm lý có tên thiên kiến xác nhận (confirmation bias).

Nếu bạn đã tin rằng học khuya hiệu quả hơn, thì nhìn thấy ai học khuya đạt điểm cao cũng thấy “ừ vậy là hợp lý rồi”, mà quên mất thực tế vẫn có số đông những người dậy sớm đạt điểm cao.

Thiên kiến tư duy 2: Ảo tưởng hiểu biết (illusion of explanatory depth)

Ngoài ra chúng ta còn dễ mắc phải ảo tưởng hiểu biết (illusion of explanatory depth).

Chúng ta quen thuộc với con số, nhưng không thực sự hiểu cách nó vận hành. Giống như việc bạn biết mở laptop mỗi ngày, nhưng hỏi chi tiết cơ chế vận hành bên trong, bạn sẽ bối rối.

Hay như khi cầm bảng báo cáo, bạn đọc lướt các chỉ số như conversion rate (tỷ lệ chuyển đổi), CPI (cost per install - chi phí trên mỗi lượt cài đặt), retention (tỷ lệ giữ chân người dùng)… và cảm giác như “hiểu hết rồi”.

Nhưng nếu ai đó hỏi sâu: “Chỉ số CPI này được tính từ chiến dịch nào? Đã phân tách ‘organic’ với ‘paid’ chưa? Bao gồm cả ‘retargeting ads’ không?”, thì bạn sẽ nhận ra mình mới chỉ quen thuộc với từ ngữ, chưa thực sự hiểu bản chất cách dữ liệu đó được hình thành.

Nhưng đau đớn hơn, càng biết ít chúng ta càng dễ tự tin rằng “mình hiểu đủ rồi” vì cái bẫy của hiệu ứng tâm lý tiếp theo.

Thiên kiến tư duy 3: Hiệu ứng Dunning-Kruger – “Mình hiểu đủ rồi”

Một nhân viên mới lướt báo cáo doanh số có thể mạnh miệng kết luận: “Doanh số giảm vì đội sales yếu!”

Trong khi chưa kịp tìm hiểu kỹ:

  • Thị trường tháng đó có biến động mùa vụ không?
  • Có thay đổi chính sách giá hay quy trình thanh toán không?
  • Có yếu tố nào từ phía đối thủ hoặc bên vận hành logistics ảnh hưởng không?

Thấy một con số thay đổi, và ngay lập tức gán cho nó một “nguyên nhân đơn giản”, là cách nhanh nhất để rơi vào cái bẫy Dunning-Kruger: tưởng rằng mình đã đủ hiểu để kết luận.

alt
Nguồn: Pexels

2. Thói quen làm việc với dữ liệu dễ dắt ta đi lạc

Thói quen 1: Lẫn lộn giữa tương quan và nguyên nhân

Thấy hai chỉ số cùng tăng thì nghĩ chúng liên quan trực tiếp.

Bạn làm marketing, thấy lượt traffic website tăng, đồng thời doanh số bán áo mưa cũng tăng.

Bạn vội kết luận: “Website chạy ads hiệu quả nên áo mưa bán đắt như tôm tươi.”

Nhưng thực ra… mùa mưa tới rồi, và ai cũng phải mua áo mưa, bất kể có nhìn thấy quảng cáo hay không.

Khi hai chỉ số cùng tăng thì không có nghĩa cái này gây ra cái kia.

Thói quen 2: Chọn lọc dữ liệu theo ý mình (cherry-picking)

Nghĩa là bạn chỉ chọn số liệu đẹp để trình bày, vô tình (hoặc cố ý) làm lệch bức tranh thực tế.

Trong buổi báo cáo tuần, bạn chỉ đưa ra những con số “ngon nghẻ” như tỷ lệ mở email 40%, lượt đăng ký tăng 15%. Nhưng lại lờ đi chuyện tỷ lệ chuyển đổi từ đăng ký sang người dùng thực tế đang tụt thảm hại.

Báo cáo trông sáng sủa, nhưng lại làm sếp ra quyết định dựa trên bức tranh thiếu mảnh ghép.

Lỗi này đôi khi không phải vì gian dối, mà đơn giản vì… muốn được nhìn nhận tốt hơn, hoặc sợ “tin xấu” phá tinh thần của buổi họp.

Thói quen 3: Quên mất bối cảnh

Một chỉ số 100% tăng trưởng nghe oai, nhưng mốc tham chiếu quá thấp thì lại là chuyện khác.

Bạn báo cáo rằng “tháng này doanh thu tăng 200%”, ai nghe cũng trầm trồ. Nhưng thực ra, tháng trước bán được 1 đơn, tháng này bán 3 đơn (lỗ sặc máu!).

Con số to là do mẫu gốc quá nhỏ, không phải do vận hành xuất sắc như bạn tưởng.

Không có bối cảnh, con số dễ tạo ra giả định sai lệch.

Thói quen 4: Tin rằng “có số liệu rồi, cứ thế quyết thôi”

Số liệu không nói dối. Nhưng cách thu thập, phân tích, và diễn giải lại rất dễ nhiễm thiên kiến.

Bạn thấy báo cáo ghi “80% người dùng mới hài lòng” và lập tức quyết định giữ nguyên toàn bộ giao diện app, không cần cải tiến gì thêm. Nhưng nếu bạn hỏi kỹ, bạn sẽ phát hiện:

  • Khảo sát chỉ gửi cho nhóm khách hàng đã trả lời tích cực trước đó
  • Những người không hài lòng thì… đã âm thầm bỏ ứng dụng mà không điền khảo sát nào hết

Số liệu đúng, nhưng bối cảnh sai. Nếu chỉ nhìn số mà quyết ngay, ta có thể bỏ qua những tín hiệu mờ nhưng quan trọng.

Sự thật cần nhớ khi xử lý thông tin

Dữ liệu tự bản thân nó không thể kể nên câu chuyện đúng đắn. Bạn phải đặt câu hỏi, gạn lọc, và kết nối thì mới thấy được bức tranh thực sự.

Một vài dấu hiệu cho thấy bạn dễ mắc kẹt ở tầng dữ liệu:

  • Làm slide nhưng chưa biết ý chính mình muốn truyền tải là gì
  • Đọc báo cáo xong mà không chốt nổi một nhận định rõ ràng
  • Đổ hết dữ liệu lên bàn mà không nhóm được thành vấn đề
  • Bị hỏi “Điều này có nghĩa gì?” thì im bặt hoặc trả lời lòng vòng

Gợi ý để bước lên tầng tiếp theo:

  • Trước khi tổng hợp dữ liệu, hãy hỏi lại: “Mình đang tìm kiếm điều gì?”
  • Nhóm dữ liệu theo chủ đề, thay vì dồn tất cả vào một bảng dài bất tận
  • Nhìn dữ liệu trong bối cảnh cụ thể, không tách rời khỏi thực tế

Cuối cùng hãy nhớ rằng có nhiều dữ liệu không có nghĩa là đã có hiểu biết. Hiểu biết đến từ cách ta xử lý và phản tư trên dữ liệu đó.

Ở bài viết tiếp theo mình sẽ chia sẻ cách biến dữ liệu thành thông tin có bối cảnh, để dữ liệu không còn chỉ là những con số rời rạc.