Ключова разлика: Data Mining всъщност е анализ на данните. Това е компютърно подпомаганият процес на изкопаване и анализиране на огромни набори от данни, които са компилирани от компютъра или са въведени в компютъра. Съхранението на данни е процес на събиране на информация или данни в хранилище за данни. Складът за данни е база данни, използвана за съхраняване на данни.
Целта на извличането на данни, известна също като откриване на знания, е да позволи на предприятията да виждат тези поведения, тенденции и / или взаимоотношения и да могат да ги вземат под внимание в своите решения. Това позволява на предприятията да вземат проактивни решения, основани на знанието.
Терминът „извличане на данни“ идва от факта, че процесът на извличане на данни, т.е. търсене на връзки между данните, е подобен на добива и търсенето на ценни материали. Инструментите за извличане на данни използват изкуствен интелект, машинно обучение, статистика и системи за бази данни, за да намерят корелации между данните. Тези инструменти могат да помогнат да се отговори на бизнес въпросите, които традиционно са отнемали много време за разрешаване.
Data Mining включва различни стъпки, включително стъпката на суровия анализ, аспектите на управлението на базата данни и данните, предварителната обработка на данни, съображенията за модели и изводи, метриките за интересност, съображенията за сложността, последващата обработка на откритите структури, визуализацията и онлайн обновяването.
Целта на хранилището на данни е да осигури гъвкав достъп до данните на потребителя. Съхраняването на данни обикновено се отнася до комбинацията от много различни бази данни в цялото предприятие.
Основната разлика между съхранението на данни и извличането на данни е, че съхранението на данни е процес на компилиране и организиране на данни в една обща база данни, докато извличането на данни е процес на извличане на значими данни от тази база данни. Извличането на данни може да се извърши само след като приключва съхранението на данни.