taavishthaman
diff --git a/‎Figure_1.png
94.9 KB b/‎Figure_1.png
94.9 KB
diff --git a/‎perceptron.py
+146 b/‎perceptron.py
+146
@@ -0,0 +1,146 @@
+import numpy as np
+import matplotlib.pyplot as plt
+from sklearn import datasets
+np.random.seed(0)
+
+#Linearly Seperable dataset using sklearn with 2 features
+X, y = datasets.make_blobs(n_samples = 1000, centers = 2, cluster_std=1.5)
+plt.scatter(X[:,0],X[:,1], c=y)
+
+#Split dataset into train and test sets
+from sklearn.model_selection import train_test_split
+X_train, X_test, Y_train, Y_test = train_test_split(X, y, test_size =0.3, random_state=1)
+
+#Flattening
+X_train_flatten = X_train.reshape(X_train.shape[0], -1).T
+X_test_flatten = X_test.reshape(X_test.shape[0], -1).T
+
+#Standardization
+X_train_flatten = (X_train_flatten)/(X_train_flatten.max())
+X_test_flatten = (X_test_flatten)/(X_test_flatten.max())
+
+#Sigmoid function
+def sigmoid(z):
+    s = 1/(1 + np.exp(-z))
+    return s
+
+#initialize_weights randomly
+def initialize_weights(dim):
+
+    W = np.random.normal((dim,1))
+    b = 0
+    return W, b
+    
+    assert(W.shape == (dim, 1))
+    assert(isinstance(b, float) or isinstance(b, int))
+
+#Propagation Function
+def propagate_func(W, b, X, Y):
+    
+    #Forward Prop
+    m = X.shape[1]
+    A = sigmoid(np.dot(W.T, X) + b)
+    cost = (- 1 / m) * np.sum(Y * np.log(A) + (1 - Y) * (np.log(1 - A)))
+    #Forward Prop
+    
+    #Backward Prop
+    dW = (1/m)*np.dot(X, (A-Y).T)
+    db = (1/m)*np.sum(A-Y)
+    #Backward Prop
+    
+    assert(dW.shape == W.shape)
+    assert(db.dtype == float)
+    cost = np.squeeze(cost)
+    assert(cost.shape == ())
+    
+    grad_dict = {"dW":dW , "db":db}
+    return grad_dict, cost
+
+#Optimization using gradient descent
+def optimize(W, b, X, Y, num_iterations, learning_rate, print_cost = False):
+    
+    costs = []
+    
+    for i in range(num_iterations):
+        
+        grad_dict, cost = propagate_func(W,b,X,Y)
+        
+        dW = grad_dict["dW"]
+        db = grad_dict["db"]
+        
+        #Gradient Descent
+        W = W - learning_rate * dW
+        b = b - learning_rate * db
+        #Gradient Descent
+        
+        if i%1000 == 0:
+            costs.append(cost)
+            
+        if print_cost and i % 1000 == 0:
+            print ("Cost after iteration %i: %f" % (i, cost))
+            
+    param_dict = {"W":W, "b":b}
+    grad_dict = {"dW":dW, "db":db}
+    
+    return param_dict, grad_dict, costs
+
+#Prediction function
+def predict(W, b, X):
+    m = X.shape[1]
+    Y_pred = np.zeros((1,m))
+    W = W.reshape(X.shape[0], 1)
+    
+    A  = sigmoid(np.dot(W.T, X)+ b)
+    
+    for i in range(m):
+        Y_pred[0,i] = 1 if A[0,i] > 0.5 else 0
+        
+    assert(Y_pred.shape == (1, m))
+        
+    return Y_pred
+
+#Perceptron Model
+def model(X_train, Y_train , X_test, Y_test, num_iterations, learning_rate, print_cost = False):
+    
+    W, b = initialize_weights(X_train.shape[0])
+    param_dict, grad_dict, costs = optimize(W, b, X_train, Y_train, num_iterations, learning_rate, print_cost)
+    
+    W = param_dict["W"]
+    b = param_dict["b"]
+    
+    Y_pred_test = predict(W, b ,X_test)
+    Y_pred_train = predict(W, b, X_train)
+    
+    print("train accuracy: {} %".format(100 - np.mean(np.abs(Y_pred_train - Y_train)) * 100))
+    print("test accuracy: {} %".format(100 - np.mean(np.abs(Y_pred_test - Y_test)) * 100))
+    
+    dict = {"costs": costs,
+            "Y_pred_test": Y_pred_test, 
+            "Y_pred_train" : Y_pred_train, 
+            "W" : W, 
+            "b" : b,
+            "learning_rate" : learning_rate,
+            "num_iterations": num_iterations}
+    
+    return dict
+
+dict = model(X_train_flatten, Y_train, X_test_flatten, Y_test, num_iterations = 100000, learning_rate =0.001, print_cost = True)
+
+W = dict["W"]
+b = dict["b"] 
+
+#Linearly seperated values x_vals
+x_vals = np.linspace(-3,6,10).reshape((10,1))
+#y_vals corresponding to x_vals using eqn W[0]*X1 + W[1]*X2 + b = 0
+y_vals = -1*((W[0]*x_vals + b)/(W[1])) 
+
+plt.xlabel('X1')
+plt.ylabel('X2')
+plt.scatter(X[:,0], X[:,1], c=y, s=0.003)
+plt.plot(x_vals, y_vals)
+
+        
+    
+    
+    
+