Coding Summary: Neural Network (Week 4) : Step By Step

# ## 1 - Packages

import numpy as np

import h5py

import matplotlib.pyplot as plt

from testCases_v4 import *

from dnn_utils_v2 import sigmoid, sigmoid_backward, relu, relu_backward

# ## 2 - Outline of the Assignment

def initialize_parameters_deep(layer_dims):

parameters = {}

L = len(layer_dims)

for l in range(1, L):

parameters['W' + str(l)] =
np.random.randn(layer_dims[l], layer_dims[l-1]) * 0.01

parameters['b' + str(l)] = np.zeros((layer_dims[l], 1))

return parameters

def linear_forward(A, W, b):

Z = np.dot(W , A) + b

cache = (A, W, b)

return Z, cache

def linear_activation_forward(A_prev, W, b, activation):

if activation == "sigmoid":

Z, linear_cache = linear_forward(A_prev, W, b)

A, activation_cache = sigmoid(Z)

elif activation == "relu":

Z, linear_cache = linear_forward(A_prev, W, b)

A, activation_cache = relu(Z)

cache = (linear_cache, activation_cache)

return A, cache

def L_model_forward(X, parameters):

caches = []

A = X

L = len(parameters) // 2

for l in range(1, L):

A_prev = A

A, cache = linear_activation_forward(

A_prev, parameters['W' + str(l)], parameters['b' + str(l)], 'relu')

caches.append(cache)

AL, cache = linear_activation_forward(

A, parameters['W' + str(L)], parameters['b' + str(L)], 'sigmoid')

caches.append(cache)

return AL, caches

def compute_cost(AL, Y):

m = Y.shape[1]

cost = (-1/m) * np.sum(Y * np.log(AL) + (1-Y) * np.log(1-AL), axis=1)

cost = np.squeeze(cost)

return cost

def linear_backward(dZ, cache):

A_prev, W, b = cache

m = A_prev.shape[1]

dW = (1/m) * np.dot(dZ , A_prev.T)

db = (1/m) * np.sum(dZ, axis = 1, keepdims = True)

dA_prev = np.dot(W.T , dZ)

return dA_prev, dW, db

def linear_activation_backward(dA, cache, activation):

linear_cache, activation_cache = cache

if activation == "relu":

dZ = relu_backward(dA, activation_cache)

dA_prev, dW, db = linear_backward(dZ, linear_cache)

elif activation == "sigmoid":

dZ = sigmoid_backward(dA, activation_cache)

dA_prev, dW, db = linear_backward(dZ, linear_cache)

return dA_prev, dW, db

def L_model_backward(AL, Y, caches):

grads = {}

L = len(caches) # the number of layers

m = AL.shape[1]

Y = Y.reshape(AL.shape) # after this line, Y is the same shape as AL

dAL = - (np.divide(Y, AL) - np.divide(1 - Y, 1 - AL))

current_cache = caches[L-1]

grads["dA" + str(L-1)], grads["dW" + str(L)], grads["db" + str(L)] =

linear_activation_backward(dAL, current_cache, 'sigmoid')

# Loop from l=L-2 to l=0

for l in reversed(range(L-1)):

current_cache = caches[l]

dA_prev_temp, dW_temp, db_temp =

linear_activation_backward(grads["dA" + str(l+1)], current_cache, 'relu')

grads["dA" + str(l)] = dA_prev_temp

grads["dW" + str(l + 1)] = dW_temp

grads["db" + str(l + 1)] = db_temp

return grads

def update_parameters(parameters, grads, learning_rate):

L = len(parameters) // 2 # number of layers in the neural network

for l in range(L):

parameters["W" + str(l+1)] =
parameters["W" + str(l+1)] - learning_rate * grads["dW" + str(l+1)]

parameters["b" + str(l+1)] =
parameters["b" + str(l+1)] - learning_rate * grads["db" + str(l+1)]

return parameters

Coding Summary

2018년 3월 26일 월요일

Neural Network (Week 4) : Step By Step

댓글 없음:

댓글 쓰기