안녕하세요. 권기만입니다.
마이닝에 관한 논문을 쓰시는데 있어서 툴을 필요로 하시는 걸 보니 Case Study를 하려고 하는 것 같습니다.
방법적인 문제에 있어서는 일단은 논문을 찾아보면, 직접 프로그래밍을 하는 경우도 많습니다. Kooperberg(http://bear.fhcrc.org/~clk/)는 직접 C 언어로 프로그램을 짜서 Classification에서의 가지치기의 문제에 관해 Polyclass의 방법에 대해서 소개를 하였습니다.
일반적으로 데이터마이닝 툴중에 Full Set으로 파는 것은 모두 가격이 상당히 비쌉니다. 하지만, Part 별로 나와 있는 것은 공짜도 있고, 평가판도 있습니다. 여기에 의사결정나무 알고리즘의 하나로 유명한 C5.0을 다운 받을 수 있는 사이트를 소개하겠습니다.
See5/C5.0은 의사결정나무분석을 하기 위한 프로그램입니다.
프로그램은 C4.5의 홈페이지인 http://www.rulequest.com/ 에서 다운을 받은 것입니다. C4.5의 알고리즘에 대한 사항은 다음을 참고하시기 바랍니다.
Michael J. A. Berry, Gordon Linoff, Data Mining Techniques for marketing, Sales and Customer Support, John Wiley & Sons Inc, 1997. (Ch.12 "Decision Trees")
Tom, M. Mitchell, Machine Learning, McGraw-Hill, Inc, 1997. (ch. 3 "Decision Tree Learning")
J. R. Quinlan, "Induction of Decision Trees", Machine Learning 1: 81-106, 1986.
--------------------- [원본 메세지] ---------------------
시험판이나 평가판 같은것,아님 비싸지 않게
구할수 있는곳이 있는지 궁금합니다.
마이닝에 관한 논문 준비중인 학생입니다.
좀 급하니 알고 계신분 메일로 연락 부탁드려요.
mounghee_lee@hotmail.com