데이터 마이닝 개요

데이터 마이닝은 빅데이터 분석을 통해 향후 결과를 예측하는 첨단 기법입니다.

데이터 마이닝이란 무엇입니까?

데이터 마이닝은 빅데이터 분석을 통해 유의미한 패턴과 규칙을 찾아내는 기술입니다. 데이터 마이닝은 데이터 과학 분야의 연구 분야로 간주되며, 과거 데이터를 설명하는 예측 분석과는 다릅니다. 반면 데이터 마이닝은 빅데이터 프로세싱을 통해 향후 결과를 예측하는 것을 목표로 합니다. 또한, 데이터 마이닝 기술은 검색 엔진 알고리즘 및 추천 시스템과 같은 최신 인공 지능 (AI) 응용 프로그램에 필요한 기계 학습(ML) 모델을 구축하는 데 사용됩니다.

데이터 마이닝 응용분야

Data Mining Applications

데이터베이스 마케팅 및 타게팅

소매업체는 고객을 더 잘 이해하기 위해 데이터 마이닝을 사용합니다. 데이터 마이닝을 통해 시장 그룹을 보다 효과적으로 구분하고 프로모션 활동을 조정하여 효과적으로 고객들을 분석하고 상이한 고객에게 맞춤형 프로모션을 제공할 수 있습니다.

신용 위험 관리 및 신용평가

은행은 대출자가 부채를 청산 및 상환할 수 있는 능력을 예측하기 위해 데이터 마이닝 모델을 사용합니다. 이러한 모델은 다양한 인구 통계 및 개인 정보를 사용하여 클라이언트에 할당된 위험 수준에 따라 자동으로 금리를 선택합니다. 모델은 대출 사정에서 신용 점수를 요인으로 사용하므로 일반적으로 신용 점수가 높은 신청자에게 더 낮은 금리가 적용됩니다.

사기 탐지 및 예방

금융 기관은 데이터 마이닝 모델을 구현하여 사기 거래를 자동으로 감지하고 차단합니다. 이런 형태의 컴퓨터 포렌식스는 각 거래에 대해 막후에서 그리고 때로는 소비자가 알지 못하는 사이에 발생합니다. 지출 습관을 추적함으로써, 이 모델은 비정상적인 거래를 경고하고 고객의 구매 확인까지 즉시 지급을 보류합니다. 데이터 마이닝 알고리즘은 구매를 확인하기 위해 전자 메일 또는 문자 알림을 통해 사기 거래로부터 소비자를 보호하기 위해 자율적으로 작동할 수 있습니다.

의료 생물 정보학

의료 전문가는 위험 요인에 따라 환자의 다양한 건강 상태에 대한 가능성을 예측하기 위해 통계 모델을 사용합니다. 인구통계, 가족 및 유전자 데이터를 모델링하여 환자가 부정적인 건강 상태의 발병을 예방하거나 조정할 수 있도록 도울 수 있습니다. 이 모델은 의사가 치료를 위해 현장에 도착하기 전에 환자를 진단하고 우선 순위를 정하는데 도움을 주기 위해 최근 개발 도상국에 배포되었습니다.

스팸 필터링

데이터 마이닝은 이메일 스팸 및 멀웨어 유입을 방지하기 위해서도 사용됩니다. 시스템은 수백만 개 악성 메시지의 공통적 특성을 분석하여 보안 소프트웨어의 개발에 영향을 줄 수 있습니다. 탐지 외에도, 이 특수 소프트웨어는 한 단계 더 나아가 이러한 메시지가 사용자의 받은 편지함에 도달하기 전에 이를 제거할 수 있습니다.

추천 시스템

추천 시스템은 온라인 소매업체들 사이에서 널리 사용되고 있습니다. 예측 가능한 소비자 행동 모델링은 이제 많은 조직의 핵심 포커스가 되었으며 경쟁의 필수요소로 간주되고 있습니다. Amazon 및 Macy's와 같은 회사는 수요를 예측하고 모든 접점에서 고객 경험을 향상시키기 위해 자체적으로 독점 데이터 마이닝 모델을 구축했습니다. Netflix는 자사의 추천 시스템 정확성을 크게 높일 수 있는 알고리즘을 위해 1백만 달러의 상금을 제안한 것으로 유명합니다. 우승한 모델은 추천의 정확도를 8% 이상 향상시켰습니다.

감정 분석

소셜 미디어 데이터의 감정 분석은 텍스트 마이닝이라는 기술을 활용하는 데이터 마이닝의 일반적인 응용 프로그램입니다. 이 방법은 사람들의 집단이 주제에 대해 어떻게 느끼는지 이해하는 데 사용됩니다. 텍스트 마이닝은 통계 패턴 인식을 통해 핵심 통찰력을 얻기 위해 소셜 미디어 채널 또는 다른 형태의 공공 콘텐츠로부터의 자료를 사용하는 것을 포함합니다. 한 걸음 더 나아가, 자연어 프로세싱(NLP) 기술은 사람들이 사용한 언어의 문맥상 의미를 찾는 데 사용될 수 있습니다.

정성적 데이터 마이닝 (QDM)

정성적 연구는 구조화된 뒤 텍스트 마이닝 기술을 사용하여 분석되어 대규모 구조화되지 않은 데이터 세트를 이해할 수 있도록 합니다. 이것이 어떻게 아동 복지를 연구하는 데 사용되었는지에 대한 심층적인 연구가 Berkley의 연구자에 의해 발표되었습니다.

데이터 마이닝 방법

효과적인 빅데이터 프로세싱에는 6단계가 포함됩니다.

  1. 비즈니스 이해

    첫 번째 단계는 프로젝트의 목표를 수립하고 어떻게 데이터 마이닝이 그 목표에 도달하는 데 도움이 되도록 하는가 하는 것입니다. 이 단계에서는 일정, 작업 및 역할 할당을 포함하도록 계획을 개발해야 합니다.

  2. 데이터 알고리즘 이해

    이 단계에서 해당되는 모든 데이터 소스에서 데이터가 수집됩니다. 데이터 시각화 도구는 데이터의 속성을 탐색하여 비즈니스 목표를 달성하는 데 도움이 되도록 이 단계에서 자주 사용됩니다.

  3. 데이터 준비

    그런 다음 데이터가 정리되고, 누락된 데이터를 포함시켜 마이닝 준비가 완료됩니다. 데이터 처리는 분석할 데이터의 양과 데이터 소스의 수에 따라 막대한 시간이 걸릴 수 있습니다. 따라서, 분산 시스템이, 단일 시스템에 부담을 주지 않고 데이터 마이닝 프로세스의 속도를 향상시키기 위해, 현대 데이터베이스 관리 시스템 (DBMS)에 사용됩니다. 또한, 이렇게 하는 것이 조직의 모든 데이터를 단일 데이터 웨어하우스에 보관하는 것보다 안전합니다. 데이터 처리 단계에서 안전 장치를 포함시켜 데이터가 영구적으로 손실되지 않도록 하는 것이 중요합니다.

  4. 빅데이터 분석

    그런 다음 정교한 데이터 분석 도구를 사용하여 데이터를 처리하고 데이터의 패턴을 찾는 데 수학적 모델을 사용합니다.

  5. 평가

    결과를 평가하여 조직 전체에 배포해야 하는지를 결정하기 위해 비즈니스 목표와 비교합니다.

  6. 배포

    마지막 단계에서 데이터 마이닝 결과는 모든 일상적인 비즈니스 운영에 걸쳐서 공유됩니다. 셀프 서비스 데이터 검색을 위한 단일 정보 소스를 제공하기 위해 엔터프라이즈 비즈니스 인텔리전스 플랫폼이 사용될 수 있습니다.

Data Mining Process

데이터 마이닝의 이점

  • 자동화된 의사 결정

    데이터 마이닝을 사용하면 조직에서 지속적으로 데이터를 분석하고, 인간에 의한 판단의 지연이 없이 일상적이고 중요한 결정 모두를 자동화할 수 있습니다. 은행은 사기 거래를 즉각적으로 감지하고 확인을 요청하며, 신원 도용으로부터 고객을 보호하기 위해 개인 정보를 보호 할 수 있습니다. 기업의 운영을 위한 데이터 알고리즘 내에 배치된 이 모델은 의사 결정을 간소화하고 조직의 일상적인 프로세스를 향상시키기 위해 데이터를 독립적으로 수집, 분석 및 실행할 수 있습니다.

  • 정확한 예견 및 예측

    계획은 모든 조직 내의 중요한 프로세스입니다. 빅데이터 분석을 통해 계획 수립을 촉진하고 관리자에게 과거 추세 및 현재 상태를 기반으로 신뢰할 수 있는 예측을 제공합니다. Macy’s는 수요 예측 모델을 구현하여 각 매장에서 각 의류 카테고리에 대한 수요를 예견하고 시장의 요구를 효율적으로 충족시킬 수 있는 적절한 재고를 배치합니다.

  • 비용 절감

    데이터 마이닝을 통해 보다 효율적으로 자원을 사용하고 할당 할 수 있습니다. 조직은 정확한 예측을 통해 계획을 수립하고 자동화된 의사 결정을 내릴 수 있으므로 비용을 최대로 절감할 수 있습니다. 델타 항공은 승객의 수하물에 RFID 칩을 넣고 데이터 마이닝 모델을 실행하여 수하물 처리절차에서의 결점을 파악하여 잘못 처리된 수하물 가방의 수를 줄였습니다. 이 프로세스 개선은 승객 만족도를 높이고 잃어버린 수하물을 찾아 재발송하는 비용을 절감했습니다.

  • 고객 정보

    기업은 고객 데이터에 대한 데이터 마이닝 모델을 실행하여 고객 간의 주요 특징과 차이점을 파악합니다. 데이터 마이닝은 개성을 파악하고 각 접점을 개인화하여 전반적인 고객 경험을 향상시키는 데 사용할 수 있습니다. 2017년, 디즈니는 “매직 밴드”(Magic Bands)를 만들고 구현하기 위해 10억 달러 이상을 투자했습니다. 이 밴드는, 리조트에서의 전반적인 경험을 향상시키는 동시에 디즈니가 고객 경험을 향상시키기 위해 분석할 그들의 활동에 대한 데이터를 수집하면서, 소비자와의 공생 관계를 유지합니다.

데이터 마이닝의 과제

데이터 마이닝은 강력한 프로세스이지만, 빅데이터의 양과 복잡성이 증가함에 따라 제약을 받고 있습니다. 기업이 매일 엑사바이트의 데이터를 수집하는 곳일 경우, 의사 결정자는 풍부한 데이터 저장소에서 추출, 분석 및 통찰력을 얻을 수 있는 방법이 필요합니다.

  • 빅데이터

    빅데이터의 과제는 많이 늘어나고 있으며, 데이터를 수집, 저장 및 분석하는 모든 분야를 망라합니다. 빅데이터는 데이터 양, 다양성, 진실성 및 속도의 크게 4가지 주요 과제로 특징 지을 수 있습니다. 데이터 마이닝의 목표는 이러한 과제를 조정하고 데이터 가치를 창출하는 것입니다.

    데이터 양은 조직에서 수집한 엄청난 양의 데이터를 저장하고 처리해야하는 어려움을 나타냅니다. 이 엄청난 양의 데이터는 두 가지 중요한 문제를 안고 있습니다. 첫째, 올바른 데이터를 찾는 것이 더욱 어려우며, 둘째, 데이터 마이닝 도구의 처리 속도가 느려진다는 것입니다.

    다양성은 수집되고 저장된 여러가지 유형의 데이터를 포괄합니다. 데이터 마이닝 도구는 다양한 데이터 형식을 동시에 처리할 수 있어야 합니다. 구조화된 데이터와 구조화되지 않은 데이터 모두에 집중하지 못하면 데이터 마이닝에 의해 부가된 가치를 무색하게 합니다. 속도는 새로운 데이터가 생성, 수집 및 저장되는 속도를 자세히 설명합니다. 데이터 양은 증가하는 저장 요건을 의미하고, 다양성은 증가하는 데이터 유형을 의미하지만, 속도는 급속하게 증가하는 데이터 생성 속도와 관련된 과제입니다.

    마지막으로, 진실성은 모든 데이터가 똑같이 정확하지는 않다는 것을 인정합니다. 데이터는 지저분하고, 불완전하며, 부적절하게 수집될 수 있으며, 심지어 편향될 수 있습니다. 무엇보다 데이터가 더 빨리 수집될수록 데이터 내에서 더 많은 오류가 나타납니다. 진실성의 과제는 데이터의 양과 품질의 균형을 맞추는 것입니다.

  • 과적합 모델

    과적합은 모델이 모집단의 기본 추세가 아닌 샘플 내의 자연 오차를 설명할 때 발생합니다. 과적합 모델은 종종 지나치게 복잡하며 과도한 독립 변수를 활용하여 예측합니다. 따라서, 데이터 양 및 다양성이 증가함에 따라 과적합의 위험이 커집니다. 변수가 너무 적으면 모델이 관련성이 없어지며, 변수가 너무 많으면 모델을 알려진 샘플 데이터로 제한합니다. 문제는 데이터 마이닝 모델에 사용되는 변수의 수를 조절하고 예측력과 정확성을 조화시키는 것입니다.

Data Mining Challenges
  • 규모의 비용

    데이터 속도가 계속해서 데이터의 양과 다양성을 증가시킴에 따라, 기업은 이러한 모델을 확장하여 전체 조직에 적용해야 합니다. 이러한 모델을 사용하여 데이터 마이닝의 모든 이점을 얻으려면 컴퓨팅 인프라 및 프로세싱 능력에 상당한 투자가 필요합니다. 규모에 도달하기 위해 조직은 대량의 다양한 데이터를 처리할 수 있는 강력한 컴퓨터, 서버 및 소프트웨어를 구입하고 유지관리해야 합니다.

  • 개인정보 보호 및 보안

    데이터의 저장 요건이 증가함에 따라 많은 기업들이 클라우드 컴퓨팅 및 저장소로 전환해야 했습니다. 클라우드는 데이터 마이닝에서 많은 현대적인 발전을 이룩했지만 해당 서비스의 성격상 중요한 개인정보 보호 및 보안 위협을 야기합니다. 조직은 파트너 및 고객의 신뢰를 유지하기 위해 악의를 가진 대상으로부터 데이터를 보호해야합니다.

    데이터 개인정보 보호로 인해 조직은 고객 데이터의 사용 및 구현에 대한 내부 규칙 및 제약을 개발해야 합니다. 데이터 마이닝은 기업에게 소비자에 대한 강력한 통찰력을 제공하는 강력한 도구입니다. 그러나, 이러한 통찰력이 어떤 점에서 개인의 사생활을 침해할 수 있습니까? 조직은 고객과의 관계를 평가하고, 소비자에게 이익이 되는 정책을 개발하고, 신뢰할 수 있는 관계를 유지하기 위해 소비자에게 이러한 정책을 알려야 합니다.

데이터 마이닝의 유형

데이터 마이닝에는 지도 및 비지도 학습의 두 가지 기본 프로세스가 있습니다.

  • 지도 학습

    지도 학습의 목표는 예측 또는 분류입니다. 이 프로세스를 개념화하는 가장 쉬운 방법은 단일 출력 변수를 찾는 것입니다. 모델의 목표가 관찰값을 예측하는 것이라면 프로세스는 지도 학습으로 간주됩니다. 한 예로 스팸 필터가 있습니다. 지도 학습을 사용하여 들어오는 이메일을 원하지 않는 콘텐츠로 분류하고 받은 편지함에서 이러한 메시지를 자동으로 제거합니다.

    지도 데이터 마이닝 접근법에 사용되는 일반적인 분석 모델은 다음과 같습니다.

    • 선형 회귀

      선형 회귀 분석은 하나 이상의 독립 입력을 사용하여 연속 변수의 값을 예측합니다. 부동산 소개업자는 평방피트, 침대 대 욕조 비율, 건축 연도 및 우편번호를 기반으로 주택의 가치를 예측하기 위해 선형 회귀 분석을 사용합니다.

    • 로지스틱 회귀

      로지스틱 회귀 분석은 하나 이상의 독립 입력을 사용하여 범주형 변수의 확률을 예측합니다. 은행은 대출 신청자가 신용 점수, 가구 소득, 연령 및 기타 개인적 요인에 따라 채무 불이행 가능성을 예측하기 위해 로지스틱 회귀 분석을 사용합니다.

    • 시계열

      시계열 모델은 시간을 주요 독립 변수로 사용하는 예측 도구입니다. Macy's와 같은 소매업체는 시계열 모델을 실행해 시간에 따른 제품 수요를 예측하고, 예측치를 활용해 필요한 수준의 재고 수준으로 정확하게 기획하고 재고량을 비축합니다.

    • 분류 또는 회귀 트리

      분류 트리는 범주형 및 연속형 목표 변수의 값을 예측하는 데 사용할 수 있는 예측 모델링 기법입니다. 데이터를 바탕으로, 이 모델은 바이너리 규칙을 만들어 유사 목표 변수 중 가장 높은 비율을 함께 나눠 그룹으로 나눕니다. 이러한 규칙에 따라, 새로운 관찰이 속하는 그룹은 예측값이 됩니다.

    • 신경망

      신경망은 뇌의 구조, 뉴런 및 그 연결에서 영감을 얻은 분석 모델입니다. 이 모델은, 원래 1940년대에 만들어졌지만, 최근 통계학자 및 데이터 과학자들에게 인기를 얻고 있습니다. 신경망은 입력을 사용하고, 그 크기에 따라 임계값 요건에 따라 노드를 “발화” 또는 “발화하지 않습니다”. 그런 다음, 이 신호는, 또는 이 신호의 부족은, 네트워크의 숨겨진 계층에 있는 다른 “발화” 신호와 결합됩니다. 여기서 프로세스는 출력이 생성될 때까지 이를 반복됩니다. 신경망의 장점 중 하나는 즉각적인 결과이므로, 자율주행차량은 이러한 모델을 배치하여 데이터를 정확하고 효율적으로 처리하여 자율적으로 중요한 결정을 내립니다.

    • K-최근접 이웃

      K- 최근접 이웃법은 과거 관측치를 기반으로 새로운 관측치를 분류하는 데 사용됩니다. 이전 방법들과는 달리, K-최근접 이웃은 모델 중심이 아니라 데이터 중심입니다. 이 방법은 데이터에 대한 근본적인 가정을 하지 않으며 입력을 해석하기 위해 복잡한 프로세스를 사용하지 않습니다. K-최근접 이웃 모델의 기본 개념은 가장 가까운 K 이웃을 식별하고 과반수의 값을 할당하여 새로운 관측을 분류한다는 것입니다. 많은 추천 시스템은 추후 더 큰 알고리즘에 의해 사용될 유사한 콘텐츠를 식별하고 분류할 수 있도록 이 방법을 끼워 넣습니다.

Types of Data Mining
  • 비지도학습

    비지도 작업은 그 안에 내재된 패턴을 드러내기 위해 데이터를 이해하고 기술하는 데 중점을 둡니다. 추천 시스템은 비지도 학습을 사용하여 사용자 패턴을 추적하고 고객 경험을 향상시키는 개인화된 추천을 제공합니다.

    비지도 데이터 마이닝 접근법에 사용되는 일반적인 분석 모델은 다음과 같습니다.

    • 클러스터링

      클러스터링 모델은 유사한 데이터를 그룹화합니다. 이들은 단일 개체를 설명하는 복잡한 데이터 세트에 가장 잘 적용됩니다. 한 예는 유사성 모델링으로서, 세그먼트 간 유사성 그룹화, 클러스터 식별 및 기존 그룹과 유사한 새 그룹을 대상으로 지정하는데 사용됩니다.

    • 연관성 분석

      연관성 분석은 장바구니 분석이라고도 하며, 자주 함께 나타나는 항목을 식별하는 데 사용됩니다. 슈퍼마켓에서는 일반적으로 이 도구를 사용해 쌍으로 구매하는 제품을 식별하고 상점에 배포해, 고객이 더 많은 상품을 지나게 하고 구매를 늘릴 수 있도록 합니다.

    • 주성분 분석

      주성분 분석은 입력 변수 간의 숨겨진 상관관계를 설명하고 원래의 데이터에 포함된 동일한 정보를 적은 변수로 포착하는 주성분이라는 새로운 변수를 생성하는 데 사용됩니다. 분석가는 동일한 수준의 정보를 전달하는 데 사용되는 변수의 수를 줄임으로써 지도 데이터 마이닝 모델의 유용성과 정확성을 높일 수 있습니다.

  • 지도 및 비지도 접근 방식의 실행

    독립적으로 각 접근법을 사용할 수 있지만, 분석하는 동안 두 접근법을 모두 사용하는 것이 일반적입니다. 각 접근 방식에는 고유한 이점이 있으며 데이터 마이닝 모델의 견고성, 안정성 및 전반적인 유용성을 높이기 위해 결합됩니다. 지도 모델은 비지도 방법에서 파생된 변수 중첩으로 이득을 얻을 수 있습니다. 예를 들어, 회귀 모델 내에서 클러스터 변수를 사용하면 분석가가 모델에서 불필요한 변수를 제거하고 정확도를 높일 수 있습니다. 비지도 접근 방식은 데이터 내의 기본 관계를 나타내기 때문에 분석가는 비지도 학습에서 얻은 통찰력을 사용하여 지도 분석을 도출해야 합니다.

데이터 마이닝 도구

데이터 마이닝 솔루션이 널리 보급되었으므로, 회사의 구제적인 목표를 철저하게 이해하고 이를 올바른 도구 및 플랫폼과 일치시키는 것이 중요합니다.

RapidMiner

RapidMiner는 Java로 작성된 오픈 소스 소프트웨어입니다. RapidMiner는 예측 분석을 수행할 수 있는 최상의 플랫폼 중 하나이며, 딥러닝, 텍스트 마이닝 및 기계 학습을 위한 통합된 환경을 제공합니다. 이 플랫폼은 사업장 내 또는 클라우드 기반 서버를 활용할 수 있으며, 다양한 조직들이 사용하고 있습니다. RapidMiner는 사용자 지정 코딩 기능과 사용자 친화적인 인터페이스 간에 훌륭한 균형을 제공하여, 코딩 및 데이터 마이닝의 견고한 기반을 가진 사람들이 플랫폼을 가장 효과적으로 활용할 수 있도록 합니다.

Orange

Orange는 Python으로 작성된 오픈 소스 구성요소 기반 소프트웨어입니다. Orange는 간단한 데이터 사전 처리 기능을 자랑하며, 기본 데이터 마이닝 분석을 위한 최고의 플랫폼 중 하나입니다. Orange는 독특하고 사용하기 쉬운 인터페이스로 데이터 마이닝에 대한 사용자 중심의 접근 방식을 택했습니다. 그러나, 가장 큰 단점 중 하나는 외부 데이터 커넥터 세트가 제한적이라는 사실입니다. Orange는 사용자 친화적인 데이터 마이닝을 찾고 사업장 내 저장소를 사용하는 조직에 적합합니다.

Mahout

Apache Foundation에서 개발한 Mahout은 비지도 학습 프로세스에 중점을 둔 오픈 소스 플랫폼입니다. 이 소프트웨어는 클러스터링, 분류 및 협업 필터링을 위한 기계 학습 알고리즘을 만드는 데 탁월합니다. Mahout은 보다 전문적인 배경을 갖춘 개인에게 적합합니다. 이 프로그램을 사용하면 수학자, 통계학자 및 데이터 과학자가 자체 알고리즘을 만들고 테스트하며 구현할 수 있습니다. Mahout에는 조직들이 최소한의 노력으로 배포할 수 있는, 권장 기능과 같은, 몇 가지 턴키 알고리즘이 포함되어 있지만, 대형 플랫폼은 전체 기능을 활용하기 위해 보다 전문적인 배경을 가진 사람을 필요로 합니다.

Microstrategy

MicroStrategy는 모든 데이터 마이닝 모델을 보완하는 비즈니스 인텔리전스 및 데이터 분석 소프트웨어입니다. 광범위한 자체 게이트웨이 및 드라이버를 통해, 플랫폼은 모든 엔터프라이즈 리소스에 연결하고 해당 데이터를 분석할 수 있습니다. MicroStrategy는 복잡한 데이터를 액세스할 수 있는 시각화로 변환하여 이를 전사적으로 배포하는 데 탁월합니다. 이 소프트웨어는 실시간으로 모든 데이터 마이닝 모델의 성능을 추적 및 분석하고, 이러한 통찰력을 의사 결정자에게 명확하게 표시할 수 있습니다. MicroStrategy와 데이터 마이닝 툴을 결합하면 사용자가 고급 데이터 마이닝 모델을 생성하고, 이들을 전사적으로 배포하며, 그 통찰력과 시장에서의 성과를 바탕으로 의사 결정을 내릴 수 있습니다.

FAQ

데이터 마이닝의 정의는 무엇입니까?
데이터 마이닝이 처음부터 필요한 이유는 무엇입니까?
데이터 마이닝의 예시는 무엇입니까?
데이터 마이닝 프로세스란 무엇입니까?
데이터 마이닝 기술이란 무엇입니까?
데이터 마이닝의 장점은 무엇입니까?
데이터 마이닝의 문제는 무엇입니까?
데이터 마이닝과 데이터 검색의 차이점은 무엇입니까?
데이터 마이닝의 향후 추세는 무엇입니까?
웹 마이닝이란 무엇입니까?
훌륭한 데이터 마이닝 도구는 어떤 것이 있습니까?
어떻게 데이터 마이닝 모델을 평가합니까?
관계형 데이터 마이닝이란 무엇입니까?