0440949 Andreas van Cranenburgh, Leren Deadline maandag 6 oktober; individueel maken 1. Gebruik de WEKA toolkit (http://www.cs.waikato.ac.nz/ml/weka/) om 2 te leren van 2 datasets, de "iris" dataset en een dataset naar keuze. Gebruik een beslisbomenleerder, een regeleerder en een neuraal netwerk. Welke methode lijkt het beste te werken? Waarom? Probeer na te gaan of de geleerde modellen van de data verschillen. Maak een kort verslag. Iris data: J48: Correctly Classified Instances 144 96 % Incorrectly Classified Instances 6 4 % Decision table (rule based) Correctly Classified Instances 139 92.6667 % Incorrectly Classified Instances 11 7.3333 % multilayer perceptron: Correctly Classified Instances 146 97.3333 % Incorrectly Classified Instances 4 2.6667 % Weather (nominal) data: J48 (decision tree learner): Correctly Classified Instances 7 50 % Incorrectly Classified Instances 7 50 % Decision table (rule based) Correctly Classified Instances 5 35.7143 % Incorrectly Classified Instances 9 64.2857 % multilayer perceptron: Correctly Classified Instances 10 71.4286 % Incorrectly Classified Instances 4 28.5714 % De methodes lijken elkaar niet ver te ontlopen wat betreft performance op de iris data, maar de perceptron is de winnaar. Bij de weerdata is het nog duidelijker dat de perceptron beter is, en komt de regelgebaseerde leerder nog slechter uit. Bij deze dataset zal meer ruis zijn. Verder kan worden opgemerkt dat de perceptron meer (cpu)tijd nodig heeft om te leren. 2. Doe uit het boek van Mitchell, hoofdstuk 4: 4.2, 4.3, 4.7 4.2 a ^ ~b: x0 = 1, x1 = a, x2 = b w0 = -1, w1 = 1.2, w2 = -1.2 (zie evt. spreadsheet) a XOR b p1 -- \ -- p3 / p2 -- p1 is een "a OR b" perceptron: x0 = 1, x1 = a, x2 = b w0 = -0.25, w1 = 0.5, w2 = 0.5 p2 is een "a AND b" perceptron: x0 = 1, x1 = a, x2 = b w0 = -0.5, w1 = 0.5, w2 = 0.5 p3 is de vorige perceptron, "a ^ ~b": x0 = 1, x1 = a, x2 = b w0 = -1, w1 = 1.2, w2 = -1.2 (zie evt. spreadsheet) 4.3 True, want voor elke invoer waar B als uitvoer waar heeft, daar zal A dat ook hebben, doordat w0 bij A hoger is heeft A een lagere drempelwaarde dan B. 4.7 w_ca w_cb w_c0 w_dc w_d0 0 1 1 1 1 1 1 1 1 1 1 1 2 1.9 1.9 1.9 1.9 1 (zie evt. spreadsheet)