Định nghĩa:
Dữ liệu thô là dữ liệu ở dạng nguyên bản, chưa qua xử lý. Dữ liệu này chưa được tổng hợp, tính trung bình, lọc hay biến đổi dưới bất kỳ hình thức nào.
Dữ liệu chi tiết đề cập đến dữ liệu ở mức chi tiết nhất — các bản ghi, sự kiện và thuộc tính riêng lẻ nằm đằng sau các con số tổng hợp mà bạn thấy trên bảng điều khiển.
Trên thực tế, hai thuật ngữ này thường được sử dụng thay thế cho nhau. Cả hai đều đề cập đến lớp dữ liệu nền tảng giúp cho việc phân tích sâu hơn và chính xác hơn trở nên khả thi.
Dữ liệu thô là gì?
Dữ liệu thô được thu thập trực tiếp từ nguồn như SDK, API, đường ống dữ liệu hoặc sự kiện thiết bị và được lưu trữ mà không qua chỉnh sửa. Đây là dữ liệu trước khi trải qua bất kỳ quá trình xử lý nào.
Nếu chỉ xem xét riêng lẻ, một bản ghi dữ liệu thô có thể không mang lại nhiều thông tin. Tuy nhiên, khi được tổng hợp lại và khi bạn có thể tự do truy vấn, lọc, kết hợp và phân tích dữ liệu đó, dữ liệu thô sẽ trở thành một trong những tài sản mạnh mẽ nhất mà đội ngũ tiếp thị di động hoặc đội ngũ sản phẩm có thể tận dụng.
Hầu hết các nền tảng phân tích đều hiển thị dữ liệu dưới dạng tổng hợp theo mặc định. Chúng lấy các bản ghi thô và hiển thị các giá trị tổng, giá trị trung bình và các số liệu tóm tắt, giúp người dùng nhanh chóng nắm bắt hiệu suất. Dữ liệu thô chính là nền tảng đằng sau những số liệu tóm tắt đó, và đó chính là thứ bạn cần khi các số liệu tóm tắt không đủ chi tiết.
Dữ liệu chi tiết là gì?
Dữ liệu chi tiết là dữ liệu được thu thập ở mức độ chi tiết nhất có thể. Trong khi dữ liệu tổng hợp cung cấp cho bạn tổng số hoặc giá trị trung bình, thì dữ liệu chi tiết cung cấp cho bạn các bản ghi riêng lẻ tạo nên tổng số đó, mỗi bản ghi đều có bộ thuộc tính, dấu thời gian và mã định danh riêng.
Một cách hữu ích để hiểu về sự khác biệt này:
| Kiểu dữ liệu | Những gì bạn thấy |
| Dữ liệu tổng hợp | Tổng doanh thu gộp từ các giao dịch mua hàng trong một ngày nhất định |
| Dữ liệu chi tiết | Mỗi giao dịch mua hàng riêng lẻ: mã sản phẩm, đơn vị tiền tệ, doanh thu gộp, doanh thu ròng, số lượng, dấu thời gian, ID quảng cáo, phiên bản hệ điều hành, v.v. |
Giao diện tổng hợp này nhanh chóng và dễ đọc.
Chế độ xem chi tiết là nơi bạn có thể phân tích, phân đoạn và xây dựng.
Dữ liệu chi tiết so với dữ liệu tổng hợp
Dữ liệu tổng hợp rất hiệu quả trong việc theo dõi. Nó cho bạn biết những gì đã xảy ra ở mức độ tổng quan và cảnh báo khi có điều gì đó có vẻ bất thường. Hầu hết các bảng điều khiển đều được xây dựng dựa trên loại dữ liệu này vì nó dễ đọc và giúp đưa ra hành động kịp thời.
Dữ liệu chi tiết chính là điều bạn cần khi muốn tìm hiểu lý do tại sao một sự việc nào đó lại xảy ra, hoặc khi câu trả lời mà bạn đang tìm kiếm không thể tìm thấy trong bản tóm tắt.
Một số việc chỉ có thể thực hiện được khi có dữ liệu chi tiết:
- Tính toán các chỉ số tùy chỉnh mà nền tảng của bạn không hiển thị theo mặc định
- Điều tra hành vi hoặc chuỗi sự kiện của một người dùng cụ thể
- Kết hợp các bộ dữ liệu từ hai nguồn khác nhau. Ví dụ: đối chiếu dữ liệu doanh thu IAP với dữ liệu xác định nguồn gốc cài đặt để xác định mạng quảng cáo nào đã thu hút người dùng thực hiện giao dịch mua hàng
- Tạo các báo cáo và bảng điều khiển tùy chỉnh phù hợp với các câu hỏi kinh doanh cụ thể của bạn
- Thực hiện phân tích nhóm với mức độ chi tiết vượt xa những gì các báo cáo có sẵn cho phép
Nếu phân tích của bạn đòi hỏi nhiều thông tin hơn những gì bảng điều khiển có thể hiển thị, bạn cần có quyền truy cập vào dữ liệu thô, chi tiết.
Tại sao dữ liệu thô lại quan trọng
Tự do đặt ra những câu hỏi của riêng mình
Các bảng điều khiển trả lời những câu hỏi mà người thiết kế đã lường trước. Dữ liệu thô cho phép bạn đặt ra những câu hỏi mà trước đây chưa ai nghĩ đến việc xây dựng báo cáo cho chúng, và từ đó thu được những câu trả lời chính xác.
Độ chính xác hơn là sự ước lượng
Dữ liệu tổng hợp luôn đi kèm với những sự đánh đổi. Các giá trị trung bình làm mờ đi sự biến động. Các tổng số che lấp phân phối thực sự bên dưới. Dữ liệu chi tiết giúp bạn có được bức tranh toàn cảnh mà không phải chấp nhận những sự đánh đổi đó.
Tính toán chỉ số tùy chỉnh
Nếu bạn cần một chỉ số mà nền tảng phân tích của bạn không tính toán sẵn, thì dữ liệu chi tiết chính là nơi bạn có thể tự xây dựng chỉ số đó. Bạn xác định logic, áp dụng logic đó vào các bản ghi thô và nhận được chính xác con số mà bạn cần.
Kết hợp tập dữ liệu
Một số phân tích có giá trị nhất đòi hỏi phải kết hợp dữ liệu từ nhiều nguồn khác nhau. Chẳng hạn, để kết hợp dữ liệu doanh thu IAP với dữ liệu phân bổ, bạn cần có các bản ghi thô từ cả hai nguồn, trong đó các bản ghi này phải có chung một mã định danh như ID người dùng hoặc ID thiết bị. Dữ liệu tổng hợp không thể được kết hợp một cách có ý nghĩa.
Kiểm toán và Điều tra
Khi một chỉ số có vẻ không chính xác hoặc kết quả chiến dịch có vẻ không như mong đợi, dữ liệu chi tiết chính là nguồn thông tin giúp bạn tìm hiểu điều gì thực sự đã xảy ra. Nó cung cấp cho bạn bằng chứng cụ thể.
Dữ liệu thô và DataVault
Đây chính là lý do Tenjin đã phát triển DataVault và Raw Data Exporter. Một trong hai là dịch vụ kho dữ liệu cho phép bạn truy cập trực tiếp vào dữ liệu thô ở cấp độ sự kiện. Raw Data Exporter cũng thực hiện chức năng tương tự, nhưng có thể truy cập trực tiếp từ bảng điều khiển Tenjin.
Thay vì chỉ giới hạn ở những thông tin hiển thị trên bảng điều khiển của Tenjin, DataVault cho phép bạn truy vấn dữ liệu của riêng mình, tạo báo cáo tùy chỉnh, kết hợp các tập dữ liệu từ nhiều nguồn khác nhau và thực hiện các phân tích chi tiết mà các báo cáo tiêu chuẩn không thể hỗ trợ. Dữ liệu của bạn vẫn thuộc quyền sở hữu của bạn, được lưu trữ, dễ dàng truy cập và sẵn sàng phục vụ cho các nhu cầu của đội ngũ.
Đối với các nhóm có nhu cầu phân tích cụ thể, các nhà khoa học dữ liệu muốn làm việc trực tiếp với các bản ghi thô, hoặc bất kỳ ai đã vượt qua giới hạn của những gì một bảng điều khiển có sẵn có thể cung cấp, DataVault giúp loại bỏ sự phụ thuộc vào các chế độ xem tổng hợp và đưa toàn bộ tập dữ liệu vào tầm tay.
Ví dụ về dữ liệu chi tiết trong tiếp thị di động
Để minh họa rõ hơn, dưới đây là một số tình huống mà dữ liệu chi tiết là cách duy nhất để tìm ra câu trả lời bạn cần:
Điều tra doanh thu
Bạn có thể xem tổng doanh thu hàng ngày trên bảng điều khiển. Tuy nhiên, để biết chính xác một người dùng cụ thể đã chi bao nhiêu cho một sản phẩm cụ thể vào một ngày cụ thể — bao gồm đơn vị tiền tệ, số lượng và doanh thu ròng sau khi trừ phí — bạn sẽ cần đến bản ghi sự kiện mua hàng thô.
Phân tích nguồn gốc
Để xác định mạng quảng cáo nào đã thúc đẩy một lượt cài đặt sau đó chuyển đổi thành người dùng trả phí, bạn cần kết hợp bản ghi phân bổ thô với sự kiện mua hàng thô bằng cách sử dụng mã định danh người dùng chung. Nếu thiếu một trong hai bản ghi này, bản ghi còn lại sẽ không có giá trị.
Phân tích nhóm khách hàng trung thành
Để xây dựng một mô hình duy trì người dùng tùy chỉnh cho một nhóm người dùng mới thu hút cụ thể, cần có dữ liệu phiên ở cấp độ sự kiện cho từng người dùng trong nhóm đó, chứ không phải tỷ lệ duy trì đã được tổng hợp sẵn.
Điều tra gian lận
Để phát hiện các mẫu bất thường trong dữ liệu nhấp chuột hoặc cài đặt — chẳng hạn như những mẫu có thể cho thấy lưu lượng truy cập không hợp lệ — bạn cần xem xét từng bản ghi riêng lẻ, chứ không phải các con số tổng hợp. Nếu phát hiện những trường hợp này, bạn có thể sử dụng một công cụ khác của chúng tôi là Site ID Optimization trên bảng điều khiển để chặn chúng ở cấp độ ID trang web.