결론부터 말하면 구글 애널리틱스 데이터, 즉 웹 데이터는 100% 신뢰해야 하는 시스템으로 사용해서는 안됩니다.
회계 시스템, 매출 시스템과는 완전히 다른 성격의 데이터 베이스이기 때문입니다.

아래 링크는 관련해서 좋은 내용을 담고 있습니다.
https://www.analyticsmania.com/post/missing-google-analytics-transactions/
링크 본문에서 웹 데이터, 그중에서도 이커머스 데이터의 데이터 부정확성에 대해 주요한 원인으로 다음과 같은 항목을 꼽습니다.
#1. Adblockers and other privacy-related browser extensions
#2. Browsers with strict privacy settings
#3. JavaScript disabled in a browser
#4. A visitor did not opt-in in your cookie-consent banner
#5. The purchase-related data layer is incorrectly configured
#6. The purchase-related data layer is not activated on a “Thank you” page at all
#7. No mechanism is implemented to prevent duplicate transactions
#8. Too many products were purchased in a single transaction
#9. Errors in browsers might prevent tracking code from working
#10. Too many interactions are tracked in the same GA session
#11. You did not publish GTM container with Ecommerce tracking
#12. Tracking codes are activated right before the redirect
#13. Multi-currency tracking is not implemented properly
#14. Internal traffic is not excluded
#15. Tracking code is activated even if the transaction was unsuccessful
#16. Reminder: there is a delay in GA
이중에서 브라우저 애드블럭, 브라우저 개인정보 셋팅, 자바스크립트 미작동, 쿠키 미동의, 중복 트랜잭션(구매) 방지 장치 없음, 리다이렉션, 내부 트랙킹 코드 포함되지 않음은 기본 웹 트래픽에도 해당되는 내용입니다. 이외에도 데이터가 불일치 할수 있는 무수한 원인들이 있는데, 트래픽 유실, 이벤트 유실, 구글 애널리틱스 리퍼럴 제외, 뷰 셋팅 등도 있구요.
예를들어 사용자가 유럽 국가에서 분석 쿠키 정책에 동의하지 않는다면, 구매 행위가 일어나도 GA는 데이터를 수집할 수 없습니다. 하지만 이커머스 플랫폼해는 해당 사용자가 상품을 구매한 것으로 정보가 등록되겠지요. 불일치가 생긴다는 의미입니다.
특정 서비스의 웹/앱 환경이 천차 만별이므로 이런 원인들을 모두 찾아내서 제거하기란 불가능에 가깝습니다. 이는 구글 애널리틱스를 포함 웹 데이터 분석 업계의 통념입니다. 그렇다고 완전히 틀려도 OK는 아니구요.
업계 통상 전체의 5% 까지는 오차를 인정해야 한다고 하고 있습니다. 하지만 그 이상일때는 웹 분석 도구에 문제를 의심해봐야겠지요.
결국 웹 분석은 위의 상황을 이해하고 현황 분석과 트렌드 분석용으로 사용되어야 합니다. 일부 분석 담당자가 데이터가 정확히 맞아야한다고 생떼를 부린다면 이 글을 보여주세요. 웹 데이터의 특성에 대해서 인지하지 못한 담당자일 가능성이 높습니다.
결론부터 말하면 구글 애널리틱스 데이터, 즉 웹 데이터는 100% 신뢰해야 하는 시스템으로 사용해서는 안됩니다.
회계 시스템, 매출 시스템과는 완전히 다른 성격의 데이터 베이스이기 때문입니다.
아래 링크는 관련해서 좋은 내용을 담고 있습니다.
https://www.analyticsmania.com/post/missing-google-analytics-transactions/
링크 본문에서 웹 데이터, 그중에서도 이커머스 데이터의 데이터 부정확성에 대해 주요한 원인으로 다음과 같은 항목을 꼽습니다.
#1. Adblockers and other privacy-related browser extensions
#2. Browsers with strict privacy settings
#3. JavaScript disabled in a browser
#4. A visitor did not opt-in in your cookie-consent banner
#5. The purchase-related data layer is incorrectly configured
#6. The purchase-related data layer is not activated on a “Thank you” page at all
#7. No mechanism is implemented to prevent duplicate transactions
#8. Too many products were purchased in a single transaction
#9. Errors in browsers might prevent tracking code from working
#10. Too many interactions are tracked in the same GA session
#11. You did not publish GTM container with Ecommerce tracking
#12. Tracking codes are activated right before the redirect
#13. Multi-currency tracking is not implemented properly
#14. Internal traffic is not excluded
#15. Tracking code is activated even if the transaction was unsuccessful
#16. Reminder: there is a delay in GA
이중에서 브라우저 애드블럭, 브라우저 개인정보 셋팅, 자바스크립트 미작동, 쿠키 미동의, 중복 트랜잭션(구매) 방지 장치 없음, 리다이렉션, 내부 트랙킹 코드 포함되지 않음은 기본 웹 트래픽에도 해당되는 내용입니다. 이외에도 데이터가 불일치 할수 있는 무수한 원인들이 있는데, 트래픽 유실, 이벤트 유실, 구글 애널리틱스 리퍼럴 제외, 뷰 셋팅 등도 있구요.
예를들어 사용자가 유럽 국가에서 분석 쿠키 정책에 동의하지 않는다면, 구매 행위가 일어나도 GA는 데이터를 수집할 수 없습니다. 하지만 이커머스 플랫폼해는 해당 사용자가 상품을 구매한 것으로 정보가 등록되겠지요. 불일치가 생긴다는 의미입니다.
특정 서비스의 웹/앱 환경이 천차 만별이므로 이런 원인들을 모두 찾아내서 제거하기란 불가능에 가깝습니다. 이는 구글 애널리틱스를 포함 웹 데이터 분석 업계의 통념입니다. 그렇다고 완전히 틀려도 OK는 아니구요.
업계 통상 전체의 5% 까지는 오차를 인정해야 한다고 하고 있습니다. 하지만 그 이상일때는 웹 분석 도구에 문제를 의심해봐야겠지요.
결국 웹 분석은 위의 상황을 이해하고 현황 분석과 트렌드 분석용으로 사용되어야 합니다. 일부 분석 담당자가 데이터가 정확히 맞아야한다고 생떼를 부린다면 이 글을 보여주세요. 웹 데이터의 특성에 대해서 인지하지 못한 담당자일 가능성이 높습니다.