'웹마이닝'에 해당되는 글 1건

  1. 2008.04.02 Web mining

Web mining

Computer/웹관련 2008. 4. 2. 23:48
반응형
Web mining의 의미는 Web log file analysis 와 Data mining이 합쳐진 것을 의미한다.

웹에서의 행동 분석과 이를 마케팅에 활용하고자 하는 요구가 많아지는 현재의 추세에

e-CRM과 함께 매우 각광을 받는 기술이다. web-mining은 다음과 같은 절차를 따른다

1. 자료 수집(Resource finding) - Web 구조, Web Log, Web 연동 데이터 베이스, 사용자 프로파일 등의 자료 수집
2. 전처리 과정 (Information Selection & Pre-processing)
3. 일반화(Generalization)
4.분석(Analysis)

등의 절차를 따른다.
Web-Mining은 다음의 3가지 방법이 있다.

1. Web contents mining - Web Resource 분석
2. Web structure - link 계층 분석
3. Web usageminig - 사용자 접속 패턴 분석

Web logdata분석에서 association rule discovery 및 군집 분석등의 방법이 있다. Association rule diecovery는 페이지간의 연관성을 파악하는 것으로 Support(지지도), Confidence(신뢰도), Sequence(시차 연관성) 등의 파라미터가 있다. n(A)를 A 페이지 방문수, n(A+B)가 A,B모두 방문, n(A->B)를 A방문 후 B방문이라고 한고 n을 전체 session 수라고 한다면

* Support = n(A,B)/n
* Confidence = n(A,B)/n(A)
* Sequence = n(A->B)/n(A) 이다.

이외에 군집 분석 방식이 있다. 고객 세분화를 위하여 군집/분류 규칙은 C5.0 기법으로, 그리고 연관 규칙은 Apriori기법 등을 사용한다. C5.0은 Quinlan이 개발하였고 귀납적 학습 방법이다. 사전 정이된 등급(Class) 와 속성(Property)간 관계를 파악하여 단계적 의사 결정 트리를 형성하고 이를 세분화, 분류, 예측 등에 이용한다.

반응형
Posted by alias
,