Mineria de Datos Aquesta prova d'avaluació continuada cobreix els mòduls 1 i 8 del programa de l'assignatura..
Enviado por Eric • 9 de Enero de 2018 • 953 Palabras (4 Páginas) • 435 Visitas
...
En funció de l’objectiu del projecte, tenim dos tipus de tècniques:
- Supervisades o predictius.
- Algoritmes classificatoris:
A partir de dades ja agrupades, es tracta de cercar les diferencies entre els diferents grups amb la finalitat de classificar-los. Treballen amb etiquetes discretes i aquets algoritmes solen ser el pas previ a la realització de prediccions. Els models típics solen ser:
- Arbres de decisió
- Taules de decisió
- Xarxes neuronals classificatòries
- Regles de classificació.
- Algoritmes predicatius: Algoritmes que tenen com objectiu obtenir el coneixement que permet predir allò que ens interessa. La predicció es basa en valors continus:
- Regressió
- Series temporals.
- No supervisats
- Models per a predicció d’un conjunt de valors no finits (Continu):
Així, utilitzarem regles de classificació però obtindrem un numero infinit d’etiquetes de classe. En aquest cas no disposem d’un coneixement previ de les dades.
- Models amb poca informació sobre el domini de les dades (Segmentació):
Es necessita trobar les similituds i agrupar els objectes similars per trobar una idea mes clara del domini. Utilitzen tècniques de clustering.
- Models descriptius amb diverses variables (Descriptius):
S’obtindran dades a partir de la relació entre diverses variables. Obtindrem models a partir de xarxes bayesianes o regles d’associació per a definir-los.
- Models que expliquen un comportament (Explicatius):
Amb les xarxes bayesianes podrem generar models que expliquin un comportament a partir d’un conjunt de variables, observant els diferents valors d’una variable determinada.
- Pren com a referència inicial la URL http://www.kdnuggets.com. Escull un producte dels que enllaça aquesta web. D'aquest producte esbrina i especifica:
- La/les fase/s que cobreixen del cicle de vida d'un projecte de mineria de dades
- La/les tecnologia/es que incorporen. En quin grup o grups de la pregunta anterior (1) els inclouries?
3 Proposa un possible projecte de Mineria de Dades que es correspongui amb la teva àrea d'activitat professional o qualsevol altra activitat que coneguis o et resulti interessant. Tot seguit:
- Realitza un esquema que indiqui com podrien se les diferents fases existents en el cicle de vida d’aquest projecte de mineria de dades. Explica les relacions que hi haurien entre totes elles i les seves peculiaritats.
4. Activitats relacionades amb el programari R
- Per treballar amb l'entorn de pràctiques disposes al wiki d'uns recursos que són una Guia d'introducció a R per Estadística però que ens seran útils.
- Llegeix els documents Matemàtiques i estadística amb R Estadística, àlgebra lineal i càlcul i L’entorn estadístic R Estructura, llenguatge i sintaxi Trobaràs detallat com instal·lar R en funció del sistema operatiu del teu ordinador i una introducció bàsica al producte.
- Instal·la i verifica el funcionament de R i R-Commander seguin algun exemple dels continguts a les guies de R.
No és necessari lliurar cap pantalla de confirmació. Senzillament donarem la fase d'instal·lació, per acabada amb el lliurament de la PAC.
...