Наука

Какво представлява извличането на данни? »Неговото определение и значение

Anonim

Извличането на данни или извличането на данни е процес на класификация чрез големи набори от данни за идентифициране на модели и установяване на връзки за решаване на проблеми чрез анализ на данни. Инструментите за извличане на данни позволяват на компаниите да прогнозират бъдещи тенденции.

При извличането на данни правилата за асоцииране се създават чрез анализ на данни за чести модели, като се използват критерии за подкрепа и доверие, за да се намерят най-важните взаимоотношения в данните. Поддръжката е честотата, с която елементите се появяват в базата данни, докато доверието е броят пъти, когато изявленията са точни.

Други параметри за извличане на данни включват анализ на последователността или маршрута, класификация, клъстериране и прогноза. Параметрите Sequence или Path Analysis търсят модели, при които едно събитие води до друго следващо събитие. Последователността е подреден списък от набори от елементи и е често срещан тип структура на данни, намираща се в много бази данни. Параметърът за класификация търси нови модели и може да доведе до промяна в начина на организиране на данните. На алгоритми за класификация прогнозират променливи въз основа на други фактори в рамките на базата данни.

Групирането на параметри визуално намира и документира групи от неизвестни досега факти. Групирането групира набор от обекти и ги обединява въз основа на това колко сходни са помежду си.

Има различни начини, по които потребителят може да разположи клъстера, като прави разлика между всеки модел на клъстера. Насърчаването на параметрите в извличането на данни може да разкрие модели в данните, които могат да доведат до разумни прогнози за бъдещето, известни също като предсказуем анализ.

Техниките за извличане на данни се използват в много области на изследвания, включително математика, кибернетика, генетика и маркетинг. Докато техниките за извличане на данни са средство за повишаване на ефективността и прогнозиране на поведението на клиентите, ако се използва правилно, бизнесът може да се разграничи от конкуренцията си чрез използване на прогнозни анализи.

Уеб добивът, вид извличане на данни, използван в управлението на взаимоотношенията с клиентите, интегрира информация, събрана от традиционните методи и техники за извличане на данни в мрежата. Уеб добивът има за цел да разбере поведението на клиентите и да оцени ефективността на даден уебсайт.