REZUMAT: |
Volumul doi al manualului „Data mining pentru științele sociale” continuă
demersul început în primul volum. În primul volum am pus oarecum bazele
conceptuale ale unui proces de analiză de tip data mining și am ilustrat procesul
de pregătire a datelor pentru analiză folosind softul RapidMiner Studio. Astfel,
în primul volum am arătat ce presupune și cum se poate face curățarea datelor,
transformarea datelor, reducerea datelor, tratarea valorilor lipsă , respectiv
câteva analize simple (pașii 1-3 ai modelului CRISP-DM). În acest volum sunt
prezentați și ilustrați următorii doi pași și anume: (4) analiza / modelarea datelor,
realizarea modelului / modelelor și (5) evaluarea modelului / modelelor. Am
preferat să lăsăm aspectele mai complexe ce țin de optimizarea și combinarea
modelelor, respectiv implementarea și re-evaluarea modelelor pentru un volum
ulterior. Tot cu scopul de a păstra volumul informațiilor într -o limită rezonabilă,
în acest volum ne-am limitat la modelele de clasificare, respectiv la doar câțiva
dintre algoritmii de clasificare. |
|