Cross Industry Standard Process for Data Mining ( CRISP-DM ) er en dataminningsprosessmodell som beskriver en ofte brukt tilnærming til å løse domeneproblemer .
Undersøkelser utført i 2002, 2004, 2007, 2014 og 2020 viser at dette er den viktigste metoden som brukes av databearbeidere. Denne metoden ble opprettet av et konsortium bestående av selskapene NCR, SPSS og Daimler-Benz. Prosessen definerer et hierarki som består av store faser, generelle oppgaver, spesialiserte oppgaver og prosessinstanser.
CRISP-DM deler data mining prosessen i seks hovedfaser:
CRISP-DM-metoden ble designet i 1996. I 1997 utviklet den seg som et EU-prosjekt finansiert av ESPRIT- programmet . Prosjektet ledes av fire selskaper: ISL, NCR Corporation , Daimler-Benz og OHRA. Denne kjernen av konsortiet gir forskjellige opplevelser til prosjektet: ISL, senere ervervet og integrert i SPSS Inc., produserer programvarepakker med prediktiv analyse med samme navn, nå integrert i IBM-gruppen. Datagiganten NCR Corporation opprettet Teradata- divisjonen som spesialiserer seg på datalagre og sin egen programvare for data mining. Daimler-Benz hadde et stort team av databearbeidere. OHRA , et forsikringsselskap, hadde nettopp begynt å utforske potensialet for bruk av data mining.
Den første versjonen av metoden ble utgitt under versjonsnummer CRISP-DM 1.0 i 1999.
I juli 2006, kunngjør konsortiet at det vil begynne å jobbe med en andre versjon av CRISP-DM. De26. september 2006, CRISP-DM SIG møtes for å diskutere forbedringer for CRISP-DM 2.0 og den resulterende veikartet. Siden22. juni 2011omdirigerer nettstedet til en side på IBM-siden dedikert til SPSS.