ridzuan05
diff --git a/‎bayes.py
Lines changed: 75 additions & 0 deletions b/‎bayes.py
Lines changed: 75 additions & 0 deletions
@@ -0,0 +1,75 @@
+import pandas as pd
+import numpy as np
+import matplotlib.pyplot as plt
+import sys
+
+# easier to work with as pandas dataframes because we can filter classes
+Xtest = pd.read_csv("mnist_csv/Xtest.txt", header=None)
+Xtrain = pd.read_csv("mnist_csv/Xtrain.txt", header=None)
+Ytest = pd.read_csv("mnist_csv/label_test.txt", header=None)
+Ytrain = pd.read_csv("mnist_csv/label_train.txt", header=None)
+
+class Bayes(object):
+    def fit(self, X, y):
+        self.gaussians = dict()
+        labels = set(y.as_matrix().flatten())
+        for c in labels:
+            current_x = Xtrain[Ytrain[0] == c]
+            self.gaussians[c] = {
+                'mu': current_x.mean(),
+                'sigma': np.cov(current_x.T),
+            }
+            # plt.imshow(self.gaussians[c]['sigma'])
+            # plt.show()
+
+    def predict_one(self, x):
+        lls = self.distributions(x)
+        return np.argmax(lls)
+
+    def predict(self, X):
+        Ypred = X.apply(lambda x: self.predict_one(x), axis=1)
+        return Ypred
+
+    def distributions(self, x):
+        lls = np.zeros(len(self.gaussians))
+        for c,g in self.gaussians.iteritems():
+            x_minus_mu = x - g['mu']
+            k1 = np.log(2*np.pi)*x.shape + np.log(np.linalg.det(g['sigma']))
+            k2 = np.dot( np.dot(x_minus_mu, np.linalg.inv(g['sigma'])), x_minus_mu)
+            ll = -0.5*(k1 + k2)
+            lls[c] = ll
+        return lls
+
+
+if __name__ == '__main__':
+    bayes = Bayes()
+    bayes.fit(Xtrain, Ytrain)
+    Ypred = bayes.predict(Xtest)
+    C = np.zeros((10,10), dtype=np.int)
+    # print len(Ypred), len(Ytest)
+    for p,t in zip(Ypred.as_matrix().flatten(), Ytest.as_matrix().flatten()):
+        C[t,p] += 1
+    print "Confusion matrix:"
+    print C
+    print "Accuracy:", np.trace(C) / 500.0
+
+    if len(sys.argv) > 1 and sys.argv[1] == 'reconstruct':
+        # show means as images
+        Q = pd.read_csv("mnist_csv/Q.txt", header=None).as_matrix()
+        for c,g in bayes.gaussians.iteritems():
+            y = np.dot(Q, g['mu'].as_matrix())
+            y = np.reshape(y, (28,28))
+            plt.imshow(y)
+            plt.title(c)
+            plt.show()
+
+    # show distributions for 3 misclassified examples
+    print "distributions for 3 misclassified examples:"
+    count = 0
+    for i,p in Ypred.iteritems():
+        if p != Ytest.loc[i][0]:
+            print "predicted:", p, "actual:", Ytest.loc[i][0]
+            print bayes.distributions(Xtest.loc[i])
+            count += 1
+        if count >= 3:
+            break