From 513cb0cd4d71393ee5b5c7e62fc6466ae80ba4a3 Mon Sep 17 00:00:00 2001
From: Zhongkai Fu <fuzhongkai@gmail.com>
Date: Thu, 25 Feb 2016 08:40:15 -0800
Subject: [PATCH] Revert "#1. Fix Forward-LSTM crash bug #2. Improve encoding
 performance by SIMD instructions"

This reverts commit 1a3070ce9cf5189b66b912782e50d6a78644b50c.
---
 RNNSharp/BiRNN.cs        |  39 ++++------
 RNNSharp/LSTMRNN.cs      |  91 ++++++++++++++--------
 RNNSharp/MathUtil.cs     |   2 +-
 RNNSharp/Matrix.cs       |  13 +---
 RNNSharp/RNN.cs          | 119 ++++++++++++----------------
 RNNSharp/RNNEncoder.cs   |   4 +-
 RNNSharp/RNNSharp.csproj |  10 +--
 RNNSharp/SimpleRNN.cs    | 162 ++++++++++++++-------------------------
 RNNSharp/neuron.cs       |  12 +--
 RNNSharp/packages.config |   8 --
 dll/txt2vec.dll          | Bin 23552 -> 23552 bytes
 11 files changed, 198 insertions(+), 262 deletions(-)
 delete mode 100644 RNNSharp/packages.config
diff --git a/RNNSharp/BiRNN.cs b/RNNSharp/BiRNN.cs
index 84ccd8c..6e9aea7 100644
--- a/RNNSharp/BiRNN.cs
+++ b/RNNSharp/BiRNN.cs
@@ -3,7 +3,6 @@
 using System.Threading.Tasks;
 using AdvUtils;
 using System.Collections.Generic;
-using System.Numerics;
 
 /// <summary>
 /// RNNSharp written by Zhongkai Fu (fuzhongkai@gmail.com)
@@ -14,7 +13,6 @@ class BiRNN : RNN
     {
         private RNN forwardRNN;
         private RNN backwardRNN;
-        private Vector<float> vecConst2 = new Vector<float>(2.0f);
 
         public BiRNN(RNN s_forwardRNN, RNN s_backwardRNN)
         {
@@ -131,7 +129,7 @@ public override float LearningRate
             }
         }
 
-        public override float GradientCutoff
+        public override double GradientCutoff
         {
             get
             {
@@ -211,7 +209,7 @@ public override void InitMem()
             backwardRNN.InitMem();
 
             //Create and intialise the weights from hidden to output layer, these are just normal weights
-            Hidden2OutputWeight = new Matrix<float>(L2, L1);
+            Hidden2OutputWeight = new Matrix<double>(L2, L1);
 
             for (int i = 0; i < Hidden2OutputWeight.Height; i++)
             {
@@ -224,7 +222,7 @@ public override void InitMem()
             Hidden2OutputWeightLearningRate = new Matrix<float>(L2, L1);
         }
 
-        public SimpleLayer[] InnerDecode(Sequence pSequence, out SimpleLayer[] outputHiddenLayer, out Matrix<float> rawOutputLayer)
+        public SimpleLayer[] InnerDecode(Sequence pSequence, out SimpleLayer[] outputHiddenLayer, out Matrix<double> rawOutputLayer)
         {
             int numStates = pSequence.States.Length;
             SimpleLayer[] mForward = null;
@@ -268,18 +266,14 @@ public SimpleLayer[] InnerDecode(Sequence pSequence, out SimpleLayer[] outputHid
                 SimpleLayer forwardCells = mForward[curState];
                 SimpleLayer backwardCells = mBackward[curState];
 
-                for (int i = 0; i < forwardRNN.L1; i+=Vector<float>.Count)
+                for (int i = 0; i < forwardRNN.L1; i++)
                 {
-                    Vector<float> v1 = new Vector<float>(forwardCells.cellOutput, i);
-                    Vector<float> v2 = new Vector<float>(backwardCells.cellOutput, i);
-                    Vector<float> v = (v1 + v2) / vecConst2;
-
-                    v.CopyTo(cells.cellOutput, i);
+                    cells.cellOutput[i] = (forwardCells.cellOutput[i] + backwardCells.cellOutput[i]) / 2.0;
                 }
             });
 
             //Calculate output layer
-            Matrix<float> tmp_rawOutputLayer = new Matrix<float>(numStates, L2);
+            Matrix<double> tmp_rawOutputLayer = new Matrix<double>(numStates, L2);
             SimpleLayer[] seqOutput = new SimpleLayer[numStates];
             Parallel.For(0, numStates, parallelOption, curState =>
             {
@@ -288,7 +282,7 @@ public SimpleLayer[] InnerDecode(Sequence pSequence, out SimpleLayer[] outputHid
 
                 matrixXvectorADD(outputCells, mergedHiddenLayer[curState], Hidden2OutputWeight, L2, L1, 0);
 
-                float[] tmp_vector = tmp_rawOutputLayer[curState];
+                double[] tmp_vector = tmp_rawOutputLayer[curState];
                 outputCells.cellOutput.CopyTo(tmp_vector, 0);
 
                 //Activation on output layer
@@ -307,7 +301,7 @@ public override int[] PredictSentenceCRF(Sequence pSequence, RunningMode running
             int numStates = pSequence.States.Length;
             //Predict output
             SimpleLayer[] mergedHiddenLayer = null;
-            Matrix<float> rawOutputLayer = null;
+            Matrix<double> rawOutputLayer = null;
             SimpleLayer[] seqOutput = InnerDecode(pSequence, out mergedHiddenLayer, out rawOutputLayer);
 
             ForwardBackward(numStates, rawOutputLayer);
@@ -332,7 +326,7 @@ public override int[] PredictSentenceCRF(Sequence pSequence, RunningMode running
                 {
                     int label = pSequence.States[curState].Label;
                     SimpleLayer layer = seqOutput[curState];
-                    float[] CRFOutputLayer = CRFSeqOutput[curState];
+                    double[] CRFOutputLayer = CRFSeqOutput[curState];
 
                     //For standard RNN
                     for (int c = 0; c < L2; c++)
@@ -348,14 +342,14 @@ public override int[] PredictSentenceCRF(Sequence pSequence, RunningMode running
             return predict;
         }
 
-        public override Matrix<float> PredictSentence(Sequence pSequence, RunningMode runningMode)
+        public override Matrix<double> PredictSentence(Sequence pSequence, RunningMode runningMode)
         {
             //Reset the network
             int numStates = pSequence.States.Length;
 
             //Predict output
             SimpleLayer[] mergedHiddenLayer = null;
-            Matrix<float> rawOutputLayer = null;
+            Matrix<double> rawOutputLayer = null;
             SimpleLayer[] seqOutput = InnerDecode(pSequence, out mergedHiddenLayer, out rawOutputLayer);
 
             if (runningMode != RunningMode.Test)
@@ -380,7 +374,7 @@ public override Matrix<float> PredictSentence(Sequence pSequence, RunningMode ru
                     {
                         layer.er[c] = -layer.cellOutput[c];
                     }
-                    layer.er[label] = 1.0f - layer.cellOutput[label];
+                    layer.er[label] = 1.0 - layer.cellOutput[label];
                 }
 
                 LearnTwoRNN(pSequence, mergedHiddenLayer, seqOutput);
@@ -413,17 +407,18 @@ private void LearnTwoRNN(Sequence pSequence, SimpleLayer[] mergedHiddenLayer, Si
                     for (int i = 0; i < Hidden2OutputWeight.Height; i++)
                     {
                         //update weights for hidden to output layer
-                        float er = outputCells.er[i];
-                        float[] vector_i = Hidden2OutputWeight[i];
+                        double er = outputCells.er[i];
+                        double[] vector_i = Hidden2OutputWeight[i];
                         for (int k = 0; k < Hidden2OutputWeight.Width; k++)
                         {
                             double delta = NormalizeGradient(mergedHiddenCells.cellOutput[k] * er);
                             double newLearningRate = UpdateLearningRate(Hidden2OutputWeightLearningRate, i, k, delta);
 
-                            vector_i[k] += (float)(newLearningRate * delta);
+                            vector_i[k] += newLearningRate * delta;
                         }
                     }
                 }
+
             },
             ()=>
             {
@@ -490,7 +485,7 @@ public override void computeHiddenLayer(State state, bool isTrain = true)
             throw new NotImplementedException("computeHiddenLayer is not implemented in BiRNN");
         }
 
-        public override void computeOutput(float[] doutput)
+        public override void computeOutput(double[] doutput)
         {
             throw new NotImplementedException("computeOutput is not implemented in BiRNN");
         }
diff --git a/RNNSharp/LSTMRNN.cs b/RNNSharp/LSTMRNN.cs
index c569f85..db52eb4 100644
--- a/RNNSharp/LSTMRNN.cs
+++ b/RNNSharp/LSTMRNN.cs
@@ -30,6 +30,10 @@ public class LSTMCell : SimpleCell
         public double wCellForget;
         public double wCellOut;
 
+        public float dCellInLearningRate;
+        public float dCellForgetLearningRate;
+        public float dCellOutLearningRate;
+
         //partial derivatives
         public double dSWCellIn;
         public double dSWCellForget;
@@ -48,6 +52,22 @@ public struct LSTMWeight
         public float wInputOutputGate;
     }
 
+    //public struct LSTMWeightLearningRate
+    //{
+    //    public float dInputCellLearningRate;
+    //    public float dInputInputGateLearningRate;
+    //    public float dInputForgetGateLearningRate;
+    //    public float dInputOutputGateLearningRate;
+    //}
+
+    //public struct LSTMWeightDerivative
+    //{
+    //    //partial derivatives. dont need partial derivative for output gate as it uses BP not RTRL
+    //    public double dSInputCell;
+    //    public double dSInputInputGate;
+    //    public double dSInputForgetGate;
+    //}
+
     public class LSTMRNN : RNN
     {
         public LSTMCell[] neuHidden;		//neurons in hidden layer
@@ -56,15 +76,10 @@ public class LSTMRNN : RNN
 
         protected Vector4[][] Input2HiddenLearningRate;
         protected Vector4[][] Feature2HiddenLearningRate;
-        protected Vector3[] CellLearningRate;
 
         protected Vector3[][] input2hiddenDeri;
         protected Vector3[][] feature2hiddenDeri;
 
-        private Vector4 vecLearningRate;
-        private Vector3 vecLearningRate3;
-
-
         public LSTMRNN()
         {
             ModelType = MODELTYPE.LSTM;
@@ -353,7 +368,7 @@ public override void SaveModel(string filename)
             //weight input->hidden
             Logger.WriteLine("Saving input2hidden weights...");
             saveLSTMWeight(input2hidden, fo);
-
+  
             if (DenseFeatureSize > 0)
             {
                 //weight fea->hidden
@@ -438,7 +453,7 @@ public override void initWeights()
             }
 
             //Create and intialise the weights from hidden to output layer, these are just normal weights
-            Hidden2OutputWeight = new Matrix<float>(L2, L1);
+            Hidden2OutputWeight = new Matrix<double>(L2, L1);
 
             for (int i = 0; i < Hidden2OutputWeight.Height; i++)
             {
@@ -484,9 +499,12 @@ public override void CleanStatus()
                 Feature2HiddenLearningRate = new Vector4[L1][];
             }
 
-            CellLearningRate = new Vector3[L1];
             Parallel.For(0, L1, parallelOption, i =>
             {
+                neuHidden[i].dCellForgetLearningRate = 0;
+                neuHidden[i].dCellInLearningRate = 0;
+                neuHidden[i].dCellOutLearningRate = 0;
+
                 Input2HiddenLearningRate[i] = new Vector4[L0];
 
                 if (DenseFeatureSize > 0)
@@ -497,8 +515,6 @@ public override void CleanStatus()
             });
 
             Hidden2OutputWeightLearningRate = new Matrix<float>(L2, L1);
-            vecLearningRate = new Vector4(LearningRate, LearningRate, LearningRate, LearningRate);
-            vecLearningRate3 = new Vector3(LearningRate, LearningRate, LearningRate);
         }
 
         public override void InitMem()
@@ -567,7 +583,7 @@ public override void ComputeHiddenLayerErr()
                 //find the error by find the product of the output errors and their weight connection.
                 SimpleCell cell = neuHidden[i];
 
-                cell.er = 0.0f;
+                cell.er = 0.0;
 
                 if (cell.mask == false)
                 {
@@ -584,22 +600,30 @@ public override void LearnOutputWeight()
             //update weights for hidden to output layer
             Parallel.For(0, L1, parallelOption, i =>
             {
-                float cellOutput = neuHidden[i].cellOutput;
+                double cellOutput = neuHidden[i].cellOutput;
                 for (int k = 0; k < L2; k++)
                 {
-                    float delta = NormalizeGradient(cellOutput * OutputLayer.er[k]);
-                    double newLearningRate = UpdateLearningRate(Hidden2OutputWeightLearningRate, k, i, delta);
+                    double delta = NormalizeGradient(cellOutput * OutputLayer.er[k]);
+                    double newLearningRate = UpdateLearningRate(Hidden2OutputWeightLearningRate, i, k, delta);
 
-                    Hidden2OutputWeight[k][i] += (float)(newLearningRate * delta);
+                    Hidden2OutputWeight[k][i] += newLearningRate * delta;
                 }
             });
         }
 
+        public double UpdateLearningRate(ref float mg, double delta)
+        {
+            double dg = mg + delta * delta;
+            mg = (float)dg;
+            return LearningRate / (1.0 + Math.Sqrt(dg));
+        }
+
         public override void LearnNet(State state, int numStates, int curState)
         {
             //Get sparse feature and apply it into hidden layer
             var sparse = state.SparseData;
             int sparseFeatureSize = sparse.Count;
+            Vector4 vecLearningRate = new Vector4(LearningRate, LearningRate, LearningRate, LearningRate);
 
             //put variables for derivaties in weight class and cell class
             Parallel.For(0, L1, parallelOption, i =>
@@ -626,6 +650,8 @@ public override void LearnNet(State state, int numStates, int curState)
                         (float)Sigmoid2_ci_netCellState_mul_SigmoidDerivative_ci_netIn,
                         (float)ci_previousCellState_mul_SigmoidDerivative_ci_netForget);
 
+                double delta = 0;
+                double newLearningRate = 0;
                 for (int k = 0; k < sparseFeatureSize; k++)
                 {
                     var entry = sparse.GetEntry(k);
@@ -647,7 +673,9 @@ public override void LearnNet(State state, int numStates, int curState)
                     vecAlpha = wlr + vecAlpha;
                     wlr_i[entry.Key] = vecAlpha;
 
-                    vecAlpha = vecLearningRate / (Vector4.SquareRoot(vecAlpha) + Vector4.One);
+                    vecAlpha = Vector4.SquareRoot(vecAlpha) + Vector4.One;
+                    vecAlpha = vecLearningRate / vecAlpha;
+
                     vecDelta = vecAlpha * vecDelta;
 
                     w.wInputCell += vecDelta.X;
@@ -685,7 +713,9 @@ public override void LearnNet(State state, int numStates, int curState)
                         vecAlpha = wlr + vecAlpha;
                         wlr_i[j] = vecAlpha;
 
-                        vecAlpha = vecLearningRate / (Vector4.SquareRoot(vecAlpha) + Vector4.One);
+                        vecAlpha = Vector4.SquareRoot(vecAlpha) + Vector4.One;
+                        vecAlpha = vecLearningRate / vecAlpha;
+
                         vecDelta = vecAlpha * vecDelta;
 
                         w.wInputCell += vecDelta.X;
@@ -706,22 +736,17 @@ public override void LearnNet(State state, int numStates, int curState)
 
 
                 //update internal weights
-                Vector3 vecCellDelta = new Vector3((float)c.dSWCellIn, (float)c.dSWCellForget, (float)c.cellState);
-                Vector3 vecCellErr = new Vector3(cellStateError, cellStateError, gradientOutputGate);
-                Vector3 vecCellLearningRate = CellLearningRate[i];
-
-                vecCellDelta = vecCellErr * vecCellDelta;
-                vecCellLearningRate += (vecCellDelta * vecCellDelta);
-                CellLearningRate[i] = vecCellLearningRate;
-
-                //LearningRate / (1.0 + Math.Sqrt(dg));
-                vecCellLearningRate = vecLearningRate3 / (Vector3.One + Vector3.SquareRoot(vecCellLearningRate));
-                vecCellDelta = vecCellLearningRate * vecCellDelta;
+                delta = cellStateError * c.dSWCellIn;
+                newLearningRate = UpdateLearningRate(ref c.dCellInLearningRate, delta);
+                c.wCellIn += newLearningRate * delta;
 
-                c.wCellIn += vecCellDelta.X;
-                c.wCellForget += vecCellDelta.Y;
-                c.wCellOut += vecCellDelta.Z;
+                delta = cellStateError * c.dSWCellForget;
+                newLearningRate = UpdateLearningRate(ref c.dCellForgetLearningRate, delta);
+                c.wCellForget += newLearningRate * delta;
 
+                delta = gradientOutputGate * c.cellState;
+                newLearningRate = UpdateLearningRate(ref c.dCellOutLearningRate, delta);
+                c.wCellOut += newLearningRate * delta;
 
                 neuHidden[i] = c;
             });
@@ -808,7 +833,7 @@ public override void computeHiddenLayer(State state, bool isTrain = true)
                 //squash output gate 
                 cell_j.yOut = Sigmoid(cell_j.netOut);
 
-                cell_j.cellOutput = (float)(cell_j.cellState * cell_j.yOut);
+                cell_j.cellOutput = cell_j.cellState * cell_j.yOut;
 
 
                 neuHidden[j] = cell_j;
@@ -816,7 +841,7 @@ public override void computeHiddenLayer(State state, bool isTrain = true)
         }
 
 
-        public override void computeOutput(float[] doutput)
+        public override void computeOutput(double[] doutput)
         {
             matrixXvectorADD(OutputLayer, neuHidden, Hidden2OutputWeight, L2, L1, 0);
             if (doutput != null)
diff --git a/RNNSharp/MathUtil.cs b/RNNSharp/MathUtil.cs
index 5494139..fbb09a2 100644
--- a/RNNSharp/MathUtil.cs
+++ b/RNNSharp/MathUtil.cs
@@ -7,7 +7,7 @@ namespace RNNSharp
 {
     class MathUtil
     {
-        public static int GetMaxProbIndex(float [] array)
+        public static int GetMaxProbIndex(double [] array)
         {
             int dim = array.Length;
             double maxValue = array[0];
diff --git a/RNNSharp/Matrix.cs b/RNNSharp/Matrix.cs
index 3af8635..2794bce 100644
--- a/RNNSharp/Matrix.cs
+++ b/RNNSharp/Matrix.cs
@@ -1,11 +1,10 @@
-﻿using System.Numerics;
-
+﻿
 /// <summary>
 /// RNNSharp written by Zhongkai Fu (fuzhongkai@gmail.com)
 /// </summary>
 namespace RNNSharp
 {
-    public class Matrix<T> where T : struct
+    public class Matrix<T>
     {
 
         public int Height { get; set; } // the number of rows
@@ -42,13 +41,7 @@ public Matrix<T> CopyTo()
 
             for (int i = 0; i < Height; i++)
             {
-                T[] m_i = m[i];
-                T[] m_saData_i = m_saData[i];
-                for (int j = 0; j < Width; j += Vector<T>.Count)
-                {
-                    Vector<T> v1 = new Vector<T>(m_saData_i, j);
-                    v1.CopyTo(m_i, j);
-                }
+                m_saData[i].CopyTo(m[i], 0);
             }
 
             return m;
diff --git a/RNNSharp/RNN.cs b/RNNSharp/RNN.cs
index 87052f3..86f5302 100644
--- a/RNNSharp/RNN.cs
+++ b/RNNSharp/RNN.cs
@@ -3,7 +3,6 @@
 using System.Threading.Tasks;
 using System.IO;
 using AdvUtils;
-using System.Numerics;
 
 /// <summary>
 /// RNNSharp written by Zhongkai Fu (fuzhongkai@gmail.com)
@@ -48,7 +47,7 @@ abstract public class RNN
         public string ModelTempFile { get { return ModelFile + ".tmp"; } }
         public virtual MODELDIRECTION ModelDirection { get; set; }
         public virtual bool bVQ { get; set; }
-        public virtual float GradientCutoff { get; set; }
+        public virtual double GradientCutoff { get; set; }
         public virtual float Dropout { get; set; }
         public virtual float LearningRate { get; set; }
         public virtual int MaxIter { get; set; }
@@ -59,13 +58,13 @@ abstract public class RNN
         public virtual int L2 { get; set; }
 
         public MODELTYPE ModelType { get; set; }
-        public Matrix<float> CRFTagTransWeights { get; set; }
+        public Matrix<double> CRFTagTransWeights { get; set; }
         public SimpleLayer OutputLayer { get; set; }
-        public Matrix<float> Hidden2OutputWeight;
+        public Matrix<double> Hidden2OutputWeight;
         public Matrix<float> Hidden2OutputWeightLearningRate;
       
         // CRF result output
-        protected Matrix<float> CRFSeqOutput;
+        protected Matrix<double> CRFSeqOutput;
         protected double logp;
         protected double minTknErrRatio = double.MaxValue;
         protected ParallelOptions parallelOption = new ParallelOptions();
@@ -76,7 +75,7 @@ abstract public class RNN
 
         public virtual void setTagBigramTransition(List<List<float>> m)
         {
-            CRFTagTransWeights = new Matrix<float>(L2, L2);
+            CRFTagTransWeights = new Matrix<double>(L2, L2);
             for (int i = 0; i < L2; i++)
             {
                 for (int j = 0; j < L2; j++)
@@ -106,7 +105,7 @@ public double UpdateLearningRate(Matrix<float> m, int i, int j, double delta)
         }
 
         //Save matrix into file as binary format
-        protected void saveMatrixBin(Matrix<float> mat, BinaryWriter fo)
+        protected void saveMatrixBin(Matrix<double> mat, BinaryWriter fo)
         {
             //Save the width and height of the matrix
             fo.Write(mat.Width);
@@ -169,14 +168,14 @@ protected void saveMatrixBin(Matrix<float> mat, BinaryWriter fo)
             }
         }
 
-        protected Matrix<float> loadMatrixBin(BinaryReader br)
+        protected Matrix<double> loadMatrixBin(BinaryReader br)
         {
             int width = br.ReadInt32();
             int height = br.ReadInt32();
             int vqSize = br.ReadInt32();
             Logger.WriteLine("Loading matrix. width: {0}, height: {1}, vqSize: {2}", width, height, vqSize);
 
-            Matrix<float> m = new Matrix<float>(height, width);
+            Matrix<double> m = new Matrix<double>(height, width);
             if (vqSize == 0)
             {
                 for (int r = 0; r < height; r++)
@@ -202,7 +201,7 @@ protected Matrix<float> loadMatrixBin(BinaryReader br)
                     for (int c = 0; c < width; c++)
                     {
                         int vqIndex = br.ReadByte();
-                        m[r][c] = (float)codeBook[vqIndex];
+                        m[r][c] = codeBook[vqIndex];
                     }
                 }
             }
@@ -239,13 +238,13 @@ public void setInputLayer(State state, int curState, int numStates, int[] predic
         public abstract void netReset(bool updateNet = false);
         public abstract void computeHiddenLayer(State state, bool isTrain = true);
 
-        public abstract void computeOutput(float[] doutput);
+        public abstract void computeOutput(double[] doutput);
 
 
-        public virtual Matrix<float> PredictSentence(Sequence pSequence, RunningMode runningMode)
+        public virtual Matrix<double> PredictSentence(Sequence pSequence, RunningMode runningMode)
         {
             int numStates = pSequence.States.Length;
-            Matrix<float> m = new Matrix<float>(numStates, L2);
+            Matrix<double> m = new Matrix<double>(numStates, L2);
             int[] predicted = new int[numStates];
             bool isTraining = true;
             if (runningMode == RunningMode.Train)
@@ -307,13 +306,11 @@ public void SoftmaxLayer(SimpleLayer layer)
                 if (cellOutput < -50) cellOutput = -50;  //for numerical stability
                 double val = Math.Exp(cellOutput);
                 sum += val;
-                layer.cellOutput[c] = (float)val;
+                layer.cellOutput[c] = val;
             }
-
-            float sumf = (float)sum;
             for (int c = 0; c < L2; c++)
             {
-                layer.cellOutput[c] /= sumf;
+                layer.cellOutput[c] /= sum;
             }
         }
 
@@ -336,7 +333,7 @@ public virtual int[] PredictSentenceCRF(Sequence pSequence, RunningMode runningM
         {
             int numStates = pSequence.States.Length;
 
-            Matrix<float> nnOutput = PredictSentence(pSequence, RunningMode.Test);
+            Matrix<double> nnOutput = PredictSentence(pSequence, RunningMode.Test);
             ForwardBackward(numStates, nnOutput);
 
             if (runningMode != RunningMode.Test)
@@ -403,16 +400,16 @@ public void UpdateBigramTransition(Sequence seq)
             //Update tag Bigram LM
             for (int b = 0;b < L2;b++)
             {
-                float[] vector_b = CRFTagTransWeights[b];
+                double[] vector_b = CRFTagTransWeights[b];
                 double[] vector_delta_b = m_DeltaBigramLM[b];
                 for (int a = 0; a < L2; a++)
                 {
-                    vector_b[a] += (float)(LearningRate * NormalizeGradient(vector_delta_b[a]));
+                    vector_b[a] += LearningRate * NormalizeGradient(vector_delta_b[a]);
                 }
             }
         }
 
-        public void ForwardBackward(int numStates, Matrix<float> m_RawOutput)
+        public void ForwardBackward(int numStates, Matrix<double> m_RawOutput)
         {
             //forward
             double[][] alphaSet = new double[numStates][];
@@ -472,12 +469,12 @@ public void ForwardBackward(int numStates, Matrix<float> m_RawOutput)
             }
 
             //Calculate the output probability of each node
-            CRFSeqOutput = new Matrix<float>(numStates, L2);
+            CRFSeqOutput = new Matrix<double>(numStates, L2);
             for (int i = 0; i < numStates; i++)
             {
                 for (int j = 0; j < L2; j++)
                 {
-                    CRFSeqOutput[i][j] = (float)Math.Exp(alphaSet[i][j] + betaSet[i][j] - m_RawOutput[i][j] - Z_);
+                    CRFSeqOutput[i][j] = Math.Exp(alphaSet[i][j] + betaSet[i][j] - m_RawOutput[i][j] - Z_);
                 }
             }
 
@@ -507,7 +504,7 @@ public float RandInitWeight()
         public virtual double TrainNet(DataSet trainingSet, int iter)
         {
             DateTime start = DateTime.Now;
-            Logger.WriteLine("Iter " + iter + " begins with learning rate alpha = " + LearningRate + " ...");
+            Logger.WriteLine("[TRACE] Iter " + iter + " begins with learning rate alpha = " + LearningRate + " ...");
 
             //Initialize varibles
             logp = 0;
@@ -519,7 +516,7 @@ public virtual double TrainNet(DataSet trainingSet, int iter)
             int wordCnt = 0;
             int tknErrCnt = 0;
             int sentErrCnt = 0;
-            Logger.WriteLine("Progress = 0/" + numSequence / 1000.0 + "K\r");
+            Logger.WriteLine("[TRACE] Progress = 0/" + numSequence / 1000.0 + "K\r");
             for (int curSequence = 0; curSequence < numSequence; curSequence++)
             {
                 Sequence pSequence = trainingSet.SequenceList[curSequence];
@@ -532,7 +529,7 @@ public virtual double TrainNet(DataSet trainingSet, int iter)
                 }
                 else
                 {
-                    Matrix<float> m;
+                    Matrix<double> m;
                     m = PredictSentence(pSequence, RunningMode.Train);
                     predicted = GetBestResult(m);
                 }
@@ -546,10 +543,10 @@ public virtual double TrainNet(DataSet trainingSet, int iter)
 
                 if ((curSequence + 1) % 1000 == 0)
                 {
-                    Logger.WriteLine("Progress = {0} ", (curSequence + 1) / 1000 + "K/" + numSequence / 1000.0 + "K");
-                    Logger.WriteLine("Training cross-entropy = {0} ", -logp / Math.Log10(2.0) / wordCnt);
-                    Logger.WriteLine("Error token ratio = {0}%", (double)tknErrCnt / (double)wordCnt * 100.0);
-                    Logger.WriteLine("Error sentence ratio = {0}%", (double)sentErrCnt / (double)curSequence * 100.0);
+                    Logger.WriteLine("[TRACE] Progress = {0} ", (curSequence + 1) / 1000 + "K/" + numSequence / 1000.0 + "K");
+                    Logger.WriteLine(" train cross-entropy = {0} ", -logp / Math.Log10(2.0) / wordCnt);
+                    Logger.WriteLine(" Error token ratio = {0}%", (double)tknErrCnt / (double)wordCnt * 100.0);
+                    Logger.WriteLine(" Error sentence ratio = {0}%", (double)sentErrCnt / (double)curSequence * 100.0);
                 }
 
                 if (SaveStep > 0 && (curSequence + 1) % SaveStep == 0)
@@ -565,9 +562,9 @@ public virtual double TrainNet(DataSet trainingSet, int iter)
 
             double entropy = -logp / Math.Log10(2.0) / wordCnt;
             double ppl = exp_10(-logp / wordCnt);
-            Logger.WriteLine("Iter " + iter + " completed");
-            Logger.WriteLine("Sentences = " + numSequence + ", time escape = " + duration + "s, speed = " + numSequence / duration.TotalSeconds);
-            Logger.WriteLine("In training: log probability = " + logp + ", cross-entropy = " + entropy + ", perplexity = " + ppl);
+            Logger.WriteLine("[TRACE] Iter " + iter + " completed");
+            Logger.WriteLine("[TRACE] Sentences = " + numSequence + ", time escape = " + duration + "s, speed = " + numSequence / duration.TotalSeconds);
+            Logger.WriteLine("[TRACE] In training: log probability = " + logp + ", cross-entropy = " + entropy + ", perplexity = " + ppl);
 
             return ppl;
         }
@@ -592,19 +589,6 @@ public static void CheckModelFileType(string filename, out MODELTYPE modelType,
         }
 
 
-        protected float NormalizeGradient(float err)
-        {
-            if (err > GradientCutoff)
-            {
-                err = GradientCutoff;
-            }
-            else if (err < -GradientCutoff)
-            {
-                err = -GradientCutoff;
-            }
-            return err;
-        }
-
         protected double NormalizeGradient(double err)
         {
             if (err > GradientCutoff)
@@ -617,15 +601,16 @@ protected double NormalizeGradient(double err)
             }
             return err;
         }
-        public void matrixXvectorADD(SimpleLayer dest, SimpleCell[] srcvec, Matrix<float> srcmatrix, int DestSize, int SrcSize, int type)
+
+        public void matrixXvectorADD(SimpleLayer dest, SimpleCell[] srcvec, Matrix<double> srcmatrix, int DestSize, int SrcSize, int type)
         {
             if (type == 0)
             {
                 //ac mod
                 Parallel.For(0, DestSize, parallelOption, i =>
                 {
-                    float[] vector_i = srcmatrix[i];
-                    float cellOutput = 0;
+                    double[] vector_i = srcmatrix[i];
+                    double cellOutput = 0;
                     for (int j = 0; j < SrcSize; j++)
                     {
                         cellOutput += srcvec[j].cellOutput * vector_i[j];
@@ -639,7 +624,7 @@ public void matrixXvectorADD(SimpleLayer dest, SimpleCell[] srcvec, Matrix<float
             {
                 Parallel.For(0, DestSize, parallelOption, i =>
                 {
-                    float er = 0;
+                    double er = 0;
                     for (int j = 0; j < SrcSize; j++)
                     {
                         er += srcvec[j].er * srcmatrix[j][i];
@@ -650,20 +635,18 @@ public void matrixXvectorADD(SimpleLayer dest, SimpleCell[] srcvec, Matrix<float
             }
         }
 
-        public void matrixXvectorADD(SimpleLayer dest, SimpleLayer srcvec, Matrix<float> srcmatrix, int DestSize, int SrcSize, int type)
+        public void matrixXvectorADD(SimpleLayer dest, SimpleLayer srcvec, Matrix<double> srcmatrix, int DestSize, int SrcSize, int type)
         {
             if (type == 0)
             {
                 //ac mod
                 Parallel.For(0, DestSize, parallelOption, i =>
                 {
-                    float[] vector_i = srcmatrix[i];
-                    float cellOutput = 0;
-                    for (int j = 0; j < SrcSize; j+=Vector<float>.Count)
+                    double[] vector_i = srcmatrix[i];
+                    double cellOutput = 0;
+                    for (int j = 0; j < SrcSize; j++)
                     {
-                        Vector<float> v1 = new Vector<float>(srcvec.cellOutput, j);
-                        Vector<float> v2 = new Vector<float>(vector_i, j);
-                        cellOutput += Vector.Dot<float>(v1, v2);
+                        cellOutput += srcvec.cellOutput[j] * vector_i[j];
                     }
                     dest.cellOutput[i] = cellOutput;
                 });
@@ -673,7 +656,7 @@ public void matrixXvectorADD(SimpleLayer dest, SimpleLayer srcvec, Matrix<float>
             {
                 Parallel.For(0, DestSize, parallelOption, i =>
                 {
-                    float er = 0;
+                    double er = 0;
                     for (int j = 0; j < SrcSize; j++)
                     {
                         er += srcvec.er[j] * srcmatrix[j][i];
@@ -684,7 +667,7 @@ public void matrixXvectorADD(SimpleLayer dest, SimpleLayer srcvec, Matrix<float>
             }
         }
 
-        public int[] GetBestResult(Matrix<float> ys)
+        public int[] GetBestResult(Matrix<double> ys)
         {
             int[] output = new int[ys.Height];
 
@@ -698,7 +681,7 @@ public int[] GetBestResult(Matrix<float> ys)
 
         public int[] DecodeNN(Sequence seq)
         {
-            Matrix<float> ys = PredictSentence(seq, RunningMode.Test);
+            Matrix<double> ys = PredictSentence(seq, RunningMode.Test);
             return GetBestResult(ys);
         }
 
@@ -707,11 +690,11 @@ public int[][] DecodeNBestCRF(Sequence seq, int N)
         {
 
             //ys contains the output of RNN for each word
-            Matrix<float> ys = PredictSentence(seq, RunningMode.Test);
+            Matrix<double> ys = PredictSentence(seq, RunningMode.Test);
 
             int n = seq.States.Length;
             int K = L2;
-            Matrix<float> STP = CRFTagTransWeights;
+            Matrix<double> STP = CRFTagTransWeights;
             PAIR<int, int>[, ,] vPath = new PAIR<int, int>[n, K, N];
             int DUMP_LABEL = -1;
             double[,] vPreAlpha = new double[K, N];
@@ -796,7 +779,7 @@ public int[][] DecodeNBestCRF(Sequence seq, int N)
             return vTagOutput;
         }
 
-        public int[] Viterbi(Matrix<float> ys, int seqLen)
+        public int[] Viterbi(Matrix<double> ys, int seqLen)
         {
             int[,] vPath = new int[seqLen, L2];
 
@@ -850,7 +833,7 @@ public int[] Viterbi(Matrix<float> ys, int seqLen)
         public int[] DecodeCRF(Sequence seq)
         {
             //ys contains the output of RNN for each word
-            Matrix<float> ys = PredictSentence(seq, RunningMode.Test);
+            Matrix<double> ys = PredictSentence(seq, RunningMode.Test);
             return Viterbi(ys, seq.States.Length);
         }
 
@@ -894,7 +877,7 @@ public void ComputeOutputLayerErr(State state, int timeat)
 
         public virtual bool ValidateNet(DataSet validationSet, int iter)
         {
-            Logger.WriteLine("Start validation ...");
+            Logger.WriteLine("[TRACE] Start validation ...");
             int wordcn = 0;
             int tknErrCnt = 0;
             int sentErrCnt = 0;
@@ -914,7 +897,7 @@ public virtual bool ValidateNet(DataSet validationSet, int iter)
                 }
                 else
                 {
-                    Matrix<float> m;
+                    Matrix<double> m;
                     m = PredictSentence(pSequence, RunningMode.Validate);
                     predicted = GetBestResult(m);
                 }
@@ -932,8 +915,8 @@ public virtual bool ValidateNet(DataSet validationSet, int iter)
             double tknErrRatio = (double)tknErrCnt / (double)wordcn * 100.0;
             double sentErrRatio = (double)sentErrCnt / (double)numSequence * 100.0;
 
-            Logger.WriteLine("In validation: error token ratio = {0}% error sentence ratio = {1}%", tknErrRatio, sentErrRatio);
-            Logger.WriteLine("In training: log probability = " + logp + ", cross-entropy = " + entropy + ", perplexity = " + ppl);         
+            Logger.WriteLine("[TRACE] In validation: error token ratio = {0}% error sentence ratio = {1}%", tknErrRatio, sentErrRatio);
+            Logger.WriteLine("[TRACE] In training: log probability = " + logp + ", cross-entropy = " + entropy + ", perplexity = " + ppl);         
             Logger.WriteLine("");
 
             bool bUpdate = false;
diff --git a/RNNSharp/RNNEncoder.cs b/RNNSharp/RNNEncoder.cs
index 6fe958a..bb4b7db 100644
--- a/RNNSharp/RNNEncoder.cs
+++ b/RNNSharp/RNNEncoder.cs
@@ -64,7 +64,7 @@ public void Train()
             rnn.MaxIter = m_modelSetting.MaxIteration;
             rnn.IsCRFTraining = m_modelSetting.IsCRFTraining;
             rnn.LearningRate = m_modelSetting.LearningRate;
-            rnn.GradientCutoff = 15.0f;
+            rnn.GradientCutoff = 15.0;
             rnn.Dropout = m_modelSetting.Dropout;
             rnn.L1 = m_modelSetting.NumHidden;
 
@@ -82,7 +82,7 @@ public void Train()
 
             Logger.WriteLine("");
 
-            Logger.WriteLine("Iterative training begins ...");
+            Logger.WriteLine("[TRACE] Iterative training begins ...");
             double lastPPL = double.MaxValue;
             double lastAlpha = rnn.LearningRate;
             int iter = 0;
diff --git a/RNNSharp/RNNSharp.csproj b/RNNSharp/RNNSharp.csproj
index c451a41..9c72646 100644
--- a/RNNSharp/RNNSharp.csproj
+++ b/RNNSharp/RNNSharp.csproj
@@ -37,10 +37,7 @@
     <Reference Include="System" />
     <Reference Include="System.Core" />
     <Reference Include="System.Numerics" />
-    <Reference Include="System.Numerics.Vectors, Version=4.1.0.0, Culture=neutral, PublicKeyToken=b03f5f7f11d50a3a, processorArchitecture=MSIL">
-      <HintPath>..\packages\System.Numerics.Vectors.4.1.0\lib\net46\System.Numerics.Vectors.dll</HintPath>
-      <Private>True</Private>
-    </Reference>
+    <Reference Include="System.Numerics.Vectors" />
     <Reference Include="System.Xml.Linq" />
     <Reference Include="System.Data.DataSetExtensions" />
     <Reference Include="Microsoft.CSharp" />
@@ -73,11 +70,6 @@
     <Compile Include="Vector.cs" />
     <Compile Include="WordEMWrapFeaturizer.cs" />
   </ItemGroup>
-  <ItemGroup>
-    <None Include="packages.config">
-      <SubType>Designer</SubType>
-    </None>
-  </ItemGroup>
   <Import Project="$(MSBuildToolsPath)\Microsoft.CSharp.targets" />
   <!-- To modify your build process, add your task inside one of the targets below and uncomment it. 
        Other similar extension points exist, see Microsoft.Common.targets.
diff --git a/RNNSharp/SimpleRNN.cs b/RNNSharp/SimpleRNN.cs
index 3f42f90..02e6347 100644
--- a/RNNSharp/SimpleRNN.cs
+++ b/RNNSharp/SimpleRNN.cs
@@ -2,7 +2,6 @@
 using System.Threading.Tasks;
 using System.IO;
 using AdvUtils;
-using System.Numerics;
 
 /// <summary>
 /// RNNSharp written by Zhongkai Fu (fuzhongkai@gmail.com)
@@ -14,12 +13,12 @@ public class SimpleRNN : RNN
         protected int bptt;
         protected int bptt_block;
         protected SimpleLayer[] bptt_hidden;
-        protected float[][] bptt_fea;
+        protected double[][] bptt_fea;
         protected SparseVector[] bptt_inputs = new SparseVector[MAX_RNN_HIST];
 
-        protected Matrix<float> mat_bptt_syn0_w;
-        protected Matrix<float> mat_bptt_syn0_ph;
-        protected Matrix<float> mat_bptt_synf;
+        protected Matrix<double> mat_bptt_syn0_w;
+        protected Matrix<double> mat_bptt_syn0_ph;
+        protected Matrix<double> mat_bptt_synf;
 
         //Last hidden layer status
         protected SimpleLayer neuLastHidden;
@@ -27,23 +26,19 @@ public class SimpleRNN : RNN
         protected SimpleLayer neuHidden;
 
         //Feature weights
-        protected Matrix<float> HiddenBpttWeights { get; set; }
-        protected Matrix<float> Input2HiddenWeights { get; set; }
-        protected Matrix<float> Feature2HiddenWeights { get; set; }
+        protected Matrix<double> HiddenBpttWeights { get; set; }
+        protected Matrix<double> Input2HiddenWeights { get; set; }
+        protected Matrix<double> Feature2HiddenWeights { get; set; }
 
         //The learning ratio of each weight
         protected Matrix<float> HiddenBpttWeightsLearningRate { get; set; }
         protected Matrix<float> Input2HiddenWeightsLearningRate { get; set; }
         protected Matrix<float> Feature2HiddenWeightsLearningRate { get; set; }
 
-        protected Vector<float> vecMaxGrad;
-        protected Vector<float> vecMinGrad;
-        protected Vector<float> vecNormalLearningRate;
-
         public SimpleRNN()
         {
             ModelType = MODELTYPE.SIMPLE;
-            GradientCutoff = 15.0f;
+            GradientCutoff = 15.0;
             Dropout = 0;
 
             L1 = 30;
@@ -118,7 +113,7 @@ private void computeHiddenActivity(bool isTrain)
         {
             Parallel.For(0, L1, parallelOption, a =>
             {
-                float cellOutput = neuHidden.cellOutput[a];
+                double cellOutput = neuHidden.cellOutput[a];
                 bool mask = neuHidden.mask[a];
                 if (mask == true)
                 {
@@ -128,7 +123,7 @@ private void computeHiddenActivity(bool isTrain)
                 {
                     if (isTrain == false)
                     {
-                        cellOutput = cellOutput * (1.0f - Dropout);
+                        cellOutput = cellOutput * (1.0 - Dropout);
                     }
 
                     if (cellOutput > 50)
@@ -140,7 +135,7 @@ private void computeHiddenActivity(bool isTrain)
                         cellOutput = -50;  //for numerical stability
                     }
 
-                    cellOutput = (float)(1.0 / (1.0 + Math.Exp(-cellOutput)));
+                    cellOutput = 1.0 / (1.0 + Math.Exp(-cellOutput));
                 }
                 neuHidden.cellOutput[a] = cellOutput;
             });
@@ -165,14 +160,14 @@ public override void computeHiddenLayer(State state, bool isTrain = true)
                 //inputs(t) -> hidden(t)
                 //Get sparse feature and apply it into hidden layer
 
-                float[] vector_b = Input2HiddenWeights[b];
-                float cellOutput = 0;
+                double[] vector_b = Input2HiddenWeights[b];
+                double cellOutput = 0;
                 for (int i = 0; i < n; i++)
                 {
                     var entry = sparse.GetEntry(i);
                     cellOutput += entry.Value * vector_b[entry.Key];
                 }
-
+                
 
                 //Dense features:
                 //fea(t) -> hidden(t) 
@@ -192,7 +187,7 @@ public override void computeHiddenLayer(State state, bool isTrain = true)
             computeHiddenActivity(isTrain);
         }
 
-        public override void computeOutput(float[] doutput)
+        public override void computeOutput(double[] doutput)
         {
             //Calculate output layer
             matrixXvectorADD(OutputLayer, neuHidden, Hidden2OutputWeight, L2, L1, 0);
@@ -231,14 +226,14 @@ public override void LearnOutputWeight()
             //Update hidden-output weights
             Parallel.For(0, L2, parallelOption, c =>
             {
-                float er = OutputLayer.er[c];
-                float[] vector_c = Hidden2OutputWeight[c];
+                double er = OutputLayer.er[c];
+                double[] vector_c = Hidden2OutputWeight[c];
                 for (int a = 0; a < L1; a++)
                 {
-                    float delta = NormalizeGradient(er * neuHidden.cellOutput[a]);
+                    double delta = NormalizeGradient(er * neuHidden.cellOutput[a]);
                     double newLearningRate = UpdateLearningRate(Hidden2OutputWeightLearningRate, c, a, delta);
 
-                    vector_c[a] += (float)(newLearningRate * delta);
+                    vector_c[a] += newLearningRate * delta;
                 }
             });
         }
@@ -260,18 +255,14 @@ private void learnBptt(State state)
                     neuHidden.er[a] *= neuHidden.cellOutput[a] * (1 - neuHidden.cellOutput[a]);
 
                     //dense weight update fea->0
-                    float[] vector_a = null;
-                    float er = neuHidden.er[a];
-                    Vector<float> vecErr = new Vector<float>(er);
+                    double[] vector_a = null;
+                    double er = neuHidden.er[a];
                     if (DenseFeatureSize > 0)
                     {
                         vector_a = mat_bptt_synf[a];
-                        for (int i = 0; i < DenseFeatureSize; i += Vector<float>.Count)
+                        for (int i = 0; i < DenseFeatureSize; i++)
                         {
-                            Vector<float> v1 = new Vector<float>(bptt_fea_step, i);
-                            Vector<float> v2 = new Vector<float>(vector_a, i);
-                            v2 += vecErr * v1;
-                            v2.CopyTo(vector_a, i);
+                            vector_a[i] += er * bptt_fea_step[i];
                         }
                     }
 
@@ -285,12 +276,9 @@ private void learnBptt(State state)
 
                     //bptt weight update
                     vector_a = mat_bptt_syn0_ph[a];
-                    for (int i = 0; i < L1; i += Vector<float>.Count)
+                    for (int i = 0; i < L1; i++)
                     {
-                        Vector<float> v1 = new Vector<float>(neuLastHidden.cellOutput, i);
-                        Vector<float> v2 = new Vector<float>(vector_a, i);
-                        v2 += vecErr * v1;
-                        v2.CopyTo(vector_a, i);
+                        vector_a[i] += er * neuLastHidden.cellOutput[i];
                     }
 
                 });
@@ -298,22 +286,17 @@ private void learnBptt(State state)
                 //propagates errors hidden->input to the recurrent part
                 matrixXvectorADD(neuLastHidden, neuHidden, HiddenBpttWeights, L1, L1, 1);
 
-                for (int a = 0; a < L1; a += Vector<float>.Count)
+                for (int a = 0; a < L1; a++)
                 {
                     //propagate error from time T-n to T-n-1
-                    Vector<float> v1 = new Vector<float>(neuLastHidden.er, a);
-                    Vector<float> v2 = new Vector<float>(last_bptt_hidden.er, a);
-                    Vector<float> v = v1 + v2;
-                    v.CopyTo(neuHidden.er, a);
+                    neuHidden.er[a] = neuLastHidden.er[a] + last_bptt_hidden.er[a];
                 }
                 if (step < bptt + bptt_block - 3)
                 {
-                    for (int a = 0; a < L1; a += Vector<float>.Count)
+                    for (int a = 0; a < L1; a++)
                     {
-                        Vector<float> v1 = new Vector<float>(last_bptt_hidden.cellOutput, a);
-                        Vector<float> v2 = new Vector<float>(last_last_bptt_hidden.cellOutput, a);
-                        v1.CopyTo(neuHidden.cellOutput, a);
-                        v2.CopyTo(neuLastHidden.cellOutput, a);
+                        neuHidden.cellOutput[a] = last_bptt_hidden.cellOutput[a];
+                        neuLastHidden.cellOutput[a] = last_last_bptt_hidden.cellOutput[a];
                     }
                 }
             }
@@ -323,31 +306,20 @@ private void learnBptt(State state)
 
             Parallel.For(0, L1, parallelOption, b =>
             {
-                float[] vector_b = null;
-                float[] vector_bf = null;
-                float[] vector_lr = null;
+                double[] vector_b = null;
+                double[] vector_bf = null;
 
                 //Update bptt feature weights
                 vector_b = HiddenBpttWeights[b];
                 vector_bf = mat_bptt_syn0_ph[b];
-                vector_lr = HiddenBpttWeightsLearningRate[b];
-
-                for (int i = 0; i < L1; i += Vector<float>.Count)
+                for (int i = 0; i < L1; i++)
                 {
-                    Vector<float> vecDelta = new Vector<float>(vector_bf, i);
-                    Vector<float> vecLearningRate = new Vector<float>(vector_lr, i);
-                    Vector<float> vecB = new Vector<float>(vector_b, i);
-                    vecDelta = Vector.Min<float>(vecDelta, vecMaxGrad);
-                    vecDelta = Vector.Max<float>(vecDelta, vecMinGrad);
-
-                    vecLearningRate += (vecDelta * vecDelta);
-                    vecLearningRate.CopyTo(vector_lr, i);
-                    vecLearningRate = vecNormalLearningRate / (Vector<float>.One + Vector.SquareRoot<float>(vecLearningRate));
+                    double delta = NormalizeGradient(vector_bf[i]);
+                    double newLearningRate = UpdateLearningRate(HiddenBpttWeightsLearningRate, b, i, delta);
 
-                    vecB += (vecLearningRate * vecDelta);
-                    vecB.CopyTo(vector_b, i);
-
-                    Vector<float>.Zero.CopyTo(vector_bf, i);
+                    vector_b[i] += newLearningRate * delta;
+                    //Clean bptt weight error
+                    vector_bf[i] = 0;
                 }
 
                 //Update dense feature weights
@@ -355,25 +327,14 @@ private void learnBptt(State state)
                 {
                     vector_b = Feature2HiddenWeights[b];
                     vector_bf = mat_bptt_synf[b];
-                    vector_lr = Feature2HiddenWeightsLearningRate[b];
-
-                    for (int i = 0; i < DenseFeatureSize; i += Vector<float>.Count)
+                    for (int i = 0; i < DenseFeatureSize; i++)
                     {
-                        Vector<float> vecDelta = new Vector<float>(vector_bf, i);
-                        Vector<float> vecLearningRate = new Vector<float>(vector_lr, i);
-                        Vector<float> vecB = new Vector<float>(vector_b, i);
-                        vecDelta = Vector.Min<float>(vecDelta, vecMaxGrad);
-                        vecDelta = Vector.Max<float>(vecDelta, vecMinGrad);
-
-                        vecLearningRate += (vecDelta * vecDelta);
-                        vecLearningRate.CopyTo(vector_lr, i);
-                        vecLearningRate = vecNormalLearningRate / (Vector<float>.One + Vector.SquareRoot<float>(vecLearningRate));
+                        double delta = NormalizeGradient(vector_bf[i]);
+                        double newLearningRate = UpdateLearningRate(Feature2HiddenWeightsLearningRate, b, i, delta);
 
-                        vecB += (vecLearningRate * vecDelta);
-                        vecB.CopyTo(vector_b, i);
-
-                        vecDelta = Vector<float>.Zero;
-                        vecDelta.CopyTo(vector_bf, i);
+                        vector_b[i] += newLearningRate * delta;
+                        //Clean dense feature weights error
+                        vector_bf[i] = 0;
                     }
                 }
 
@@ -390,10 +351,10 @@ private void learnBptt(State state)
                     {
                         int pos = sparse.GetEntry(i).Key;
 
-                        float delta = NormalizeGradient(vector_bf[pos]);
+                        double delta = NormalizeGradient(vector_bf[pos]);
                         double newLearningRate = UpdateLearningRate(Input2HiddenWeightsLearningRate, b, pos, delta);
 
-                        vector_b[pos] += (float)(newLearningRate * delta);
+                        vector_b[pos] += newLearningRate * delta;
 
                         //Clean sparse feature weight error
                         vector_bf[pos] = 0;
@@ -413,15 +374,15 @@ public void resetBpttMem()
                 bptt_hidden[i] = new SimpleLayer(L1);
             }
 
-            bptt_fea = new float[bptt + bptt_block + 2][];
+            bptt_fea = new double[bptt + bptt_block + 2][];
             for (int i = 0; i < bptt + bptt_block + 2; i++)
             {
-                bptt_fea[i] = new float[DenseFeatureSize];
+                bptt_fea[i] = new double[DenseFeatureSize];
             }
 
-            mat_bptt_syn0_w = new Matrix<float>(L1, L0);
-            mat_bptt_syn0_ph = new Matrix<float>(L1, L1);
-            mat_bptt_synf = new Matrix<float>(L1, DenseFeatureSize);
+            mat_bptt_syn0_w = new Matrix<double>(L1, L0);
+            mat_bptt_syn0_ph = new Matrix<double>(L1, L1);
+            mat_bptt_synf = new Matrix<double>(L1, DenseFeatureSize);
         }
 
         public override void CleanStatus()
@@ -430,21 +391,17 @@ public override void CleanStatus()
             Input2HiddenWeightsLearningRate = new Matrix<float>(L1, L0);
             Feature2HiddenWeightsLearningRate = new Matrix<float>(L1, DenseFeatureSize);
             HiddenBpttWeightsLearningRate = new Matrix<float>(L1, L1);
-
-            vecMaxGrad = new Vector<float>(GradientCutoff);
-            vecMinGrad = new Vector<float>(-GradientCutoff);
-            vecNormalLearningRate = new Vector<float>(LearningRate);
         }
         public override void InitMem()
         {
             CreateCells();
 
-            Hidden2OutputWeight = new Matrix<float>(L2, L1);
-            Input2HiddenWeights = new Matrix<float>(L1, L0);
-            Feature2HiddenWeights = new Matrix<float>(L1, DenseFeatureSize);
-            HiddenBpttWeights = new Matrix<float>(L1, L1);
+            Hidden2OutputWeight = new Matrix<double>(L2, L1);
+            Input2HiddenWeights = new Matrix<double>(L1, L0);
+            Feature2HiddenWeights = new Matrix<double>(L1, DenseFeatureSize);
+            HiddenBpttWeights = new Matrix<double>(L1, L1);
 
-            Logger.WriteLine("Initializing weights, random value is {0}", rand.NextDouble());// yy debug
+            Logger.WriteLine("[TRACE] Initializing weights, random value is {0}", rand.NextDouble());// yy debug
             initWeights();
 
             //Initialize BPTT
@@ -455,7 +412,7 @@ public override void netReset(bool updateNet = false)   //cleans hidden layer ac
         {
             for (int a = 0; a < L1; a++)
             {
-                neuHidden.cellOutput[a] = 0.1f;
+                neuHidden.cellOutput[a] = 0.1;
                 neuHidden.mask[a] = false;
             }
 
@@ -503,7 +460,7 @@ public override void LearnNet(State state, int numStates, int curState)
             //Shift memory needed for bptt to next time step, 
             //and save current hidden and feature layer nodes values for bptt
             SimpleLayer last_bptt_hidden = bptt_hidden[maxBptt];
-            float[] last_bptt_fea = bptt_fea[maxBptt];
+            double[] last_bptt_fea = bptt_fea[maxBptt];
             for (int a = maxBptt; a > 0; a--)
             {
                 bptt_inputs[a] = bptt_inputs[a - 1];
@@ -600,7 +557,7 @@ private void CreateCells()
         }
 
         // save model as binary format
-        public override void SaveModel(string filename)
+        public override void SaveModel(string filename) 
         {
             StreamWriter sw = new StreamWriter(filename);
             BinaryWriter fo = new BinaryWriter(sw.BaseStream);
@@ -650,4 +607,3 @@ public override void SaveModel(string filename)
         }
     }
 }
-
diff --git a/RNNSharp/neuron.cs b/RNNSharp/neuron.cs
index b1c6753..3de89a0 100644
--- a/RNNSharp/neuron.cs
+++ b/RNNSharp/neuron.cs
@@ -7,22 +7,22 @@ namespace RNNSharp
     public class SimpleCell
     {
         //cell output
-        public float cellOutput;
-        public float er;
+        public double cellOutput;
+        public double er;
         public bool mask;
     }
 
     public class SimpleLayer
     {
-        public float[] cellOutput;
-        public float[] er;
+        public double[] cellOutput;
+        public double[] er;
         public bool[] mask;
         public int size;
 
         public SimpleLayer(int m)
         {
-            cellOutput = new float[m];
-            er = new float[m];
+            cellOutput = new double[m];
+            er = new double[m];
             mask = new bool[m];
 
             size = m;
diff --git a/RNNSharp/packages.config b/RNNSharp/packages.config
deleted file mode 100644
index 330943d..0000000
--- a/RNNSharp/packages.config
+++ /dev/null
@@ -1,8 +0,0 @@
-﻿<?xml version="1.0" encoding="utf-8"?>
-<packages>
-  <package id="System.Globalization" version="4.0.10" targetFramework="net46" />
-  <package id="System.Numerics.Vectors" version="4.1.0" targetFramework="net46" />
-  <package id="System.Resources.ResourceManager" version="4.0.0" targetFramework="net46" />
-  <package id="System.Runtime" version="4.0.20" targetFramework="net46" />
-  <package id="System.Runtime.Extensions" version="4.0.10" targetFramework="net46" />
-</packages>
\ No newline at end of file
diff --git a/dll/txt2vec.dll b/dll/txt2vec.dll
index 54ff5ca42f437bc055c2e5bf1aed35212dad0e29..35fb8f12093b9254e920814a2ab2f41089c067bd 100644
GIT binary patch
delta 6486
zcmZu$33ydSmOfQ?zc<UfdC5ycwimL!yeyIcLRbW36O0TJL_ldlVKAWF@Lp_z5FZhU
z&7y*Zw$Oq=&q(7q-C`V<PwkNz?XlZ&MVWCMp=VTVX%&~z9v$t!>Lp0}>-)a^b+$U^
zRMn}vbz#F}Y{O%0$EMWMUQVxihvrfL^C=CDdVCm>l;{Iev{6NGV6u@k|3Pg^nSA!+
z4|4fvw0JYoL`4rYM4>bvO*cSJp`GQq#s;EmwVmZdjBgV}#bR~axbi5`MKBn68atP*
z=>#)kE+C4(d15Q83(p62&NC4qMH7qpvMVQpa;FoWsv~0XIZDjtT`Vg8oma4-;#1xN
zI<8FwuGAg}R_U8qqqtv>L;Jd3#mdAt`pmN7L}qdbkz2K48is6sXPze|MUa3V*0<EK
zwa_aF=Mee4D<3w=kz&1F$?Lkr-`iu@IB~)*6-7=ZZ|)IOoXQs1hKK3YgVsf#B+@fo
zQ;P%@Aj}{N<XvU()95Asji@6z5{B!{pj_;8N?5gc(wX58>ci1VMBH&@<>=}~GU_@k
zdrv0siok~xG@y6GLemL`iq-D&S$8082EuB|QBb(K9#6(WbW39{b8)-n7<i<+08QNj
zEC1GJ%wJWc%-I`^hB_nZAxx%YNA`4Qi>No{M|;g+3>0uvG|Z$*MwB@yKx9RCp>(Mx
zM~>3XsLRaZu}V;pZq$ShrV32MAKp2R^m6!j5zI_cPz~AJVux2S_aMZMukQ&P+&5y`
zNFZ$bW@N%9$kTp(GiZW&RhRUaKVP{Wr0MddVz|S*Fi1VWu~j_ewa)Qj8`gc@xvhP|
z-0#2t-VCrlZk0EtPBCg+3@$m9P{|m|LOiUVNo5!%m~*BvJz<fIzHMG6b75rAr7+GG
z2Qsc=A;B^~7vr*uM0QpK%Ms(Vrn7M0=B&kx)r$AC%UNxo9lD#b0&&1E$SKD7>aw|?
z>4$vX_OoL};(31(%N3b953+*3U+2u@EKlU+{Rb=T`(vJkZhc=ye#VVzjVL1SER0Sw
z>TM&|DyP)rU04{sWh-(q>MPRH`l7@w8g=B~iaEj38V6%TVattJ7?IN*>Z=kjiIasD
zEs67V>WC=Iw3Qaig;nBKhzA_-F1f(lN5EU!Rb5fyU&W*$d1LdW!x$#eH0qm-;1Yz1
zG{yRJi}J1-^oulw5*5baAVw@Ab`B}4UNTr7=P^_#JfegL5}lRUD~=B-Z~SPmDNm0h
z(PC0ZY?d5e7q)^P!;noa)+(xsD)>}W%q*(C;BTPKkJ5%AW^y*jZX~TIv3PDqB&^rP
z_;)4_05drUl4KhoZ1_figUGefUM7wd6`S+G1(%CsMRT|?MNM&>9TsznYqM+7QU4(a
z@o{!xO3LD;ylXtd$o2x+PUBtU&;~fs+!!aSi~l$+(Sn5#HSpZ{0DlGe_$<BN=9=6#
zW*luywsHe<dI~FzNy1?y1JvUnkZpkN3@?$mCZZ*o@hic3bsae@wg^;4@<%}I=`K{i
z9$W>c+DUwfnG3EGmzR`eE*>Q5Dap%O0!c7d!qouyxkmh=WONgv_&m83qHZ}Ho?IqL
znE*}{IncA`&gkcmXR=iIrA?)OL?p}Cx8rDK>G@D(>~GOIxm+wRZDiMq+e^z?jW|*o
z$!v!>Jt{j`AzmwuR>>)<&pCI3y0CTicrNBd9=0<Pt56h{T|NUVIk0KXV5Rhb9l*1K
z>(ONJbgME=lbL^gG>NCh<7FLem54`UUMVI&Z26WI1Y%Kip4$Oe`|IkgV6}KEIvGi`
z@`9`%lJ+fRT~l7(f|m#;3-jc<W`H-Jn@j?{MBE;<87wX6gxu28O(f_PJ>_|mZ-6Y4
zSr@jlbX#BO%-_8-_%TFI{`^cwZ~oBEpPylC&CgrGjgXqb8iiN_H(rFZ=|R+3v3R4r
zw&`r(4Evl?QL!M9YnG->)g*4R#qgn{hp&aBfzp!2gpE>^qpNBP8;)<NN=mMSCg=h{
zb&c3JG&26w;IT!*=ID=PA*`1^tVr0YtMILK9=;QFL#kHNH}AeKxJjHDTI{5xrJZmc
z5vgcu8f>uvx>v&<4tZH}zMFQSin<3X-wSRQYbwf}jgraO9c&T@D=JdBskq_H(c6(n
zPG+oEa#=Z9v0Fd{KLMm?p>cSk(xDD0ww#rzGCkMyoVr!7ZM)w*P^%Trt{WmH(zBl(
z;7oRdZB#57yoR#<>~mc;A4f9V#p22#mRvzASR;BW&nqiI(d4>`r;y4yr?R15=U(zw
z@ls_OyG?vjnK$n9!6xaQhe|(N^_h;U`Y>(@vih-Z>DEMbPpoP#EpgArxE=bqx+zpA
zcYv-=?i4$!iXwsRmu34|!5yILNB9;<A&yq%vJP>)Dhm9ns)FqoMb(9~&sJL4^F6Gt
ztZER(0Fkb+NZ79%1F_}%!7f<zPhC!3A%wP{<NLm`P*uCwR9(+X#gXa}7Vb;9J9UfG
z)n&NKWz-au^-JJDm14Jvg0QV_3yon1cZ$h14Y=a1t|@1C2~ktQn#H3vrR=BTcujo#
z|6~$X+(a}RulOilH5F~0iS|{?u{&`e!wK@53)y9DGzG^m-fdJd{jwQT(9Q+FON@^V
zFT~;#P9WSHh<=JcbWoOMVoR(xHNnF50gp*F##q;+T?((z-*B?&3YeO-Q9ovx<Qft`
zQgoN1rz>2naF3D)dNDj)qVPo}`6vB+)1<qsB>H~qN}NR!pKyC&xrI)rm`TmL3_L`a
zqUlQgf;|KBXX!LBh0blX*^#NdtjW%8j@0_R7_O7b<}>@KXVQDB*GgzzdfM9SF7NO4
z2yC(_r7T_LVUa2QoItFUNh?&yVU`RZ@g%N*+NF@Q7xV$8{fNsBWwylU6uzl~y{WW|
zRYET~GNEFX)+9})*kH=E)_TR}a(WM|okb`3BeqFbB9$D<l^)`hmmZTPJ3L|}ttY4j
zrt<khAtU^-M!ygX;zgmM-rH;{W`aYC<#xoTcr0Z*Qka9wv=r{NB-cWvimO!II4V=z
z7E|gbQax$7N@D+#<QhpU57B=j$W;8A;5<ZAG2v6O93xQ7J6M}OZv$iVfd5bPbd!3m
zg}_HFMW+-)`XZgtB$zUaTZ@4gI7@+sy<8t~(al!E#W0{rtGIMg>$L%I;Vbn^H~8p#
z>4vKnMwOpe-2fh9JPG_Q>yq9~=|ALd1U_s^Oxh{geC<eF>}`a*BxsZVWJuR{vqiw`
zHHm==cG{8h7Zm-f!WFKR+{Pu|Y|FmSs=l3?OtB4eM#HHWxI<x*OZs;TOPsAKFfnH<
za1_4{9ggukfV*tz?k)sFXEhV!6b|D{Ax}@>Z=Ab8cd|XOIqK{K-tHX&evI&p*1Nxg
zb{$4+(ka#pyhNpY$a@%c!hKRdpFX9h^;86F`;2~3RMtyx!4Ag+KYI|jN^vLIH2Y;Z
z?m4SFu5)@Y&C#RI+qy>U%Lz{pwXqL$ot{x#FXd!>rW;f_RO))^CjNiAMN<a26gLcq
zb`7xjEb{2wWHRY)d}&Fi2T=T(w7oLTJ<3nBOggQ&blO=o0Uuh@@(3$8vS@KX_Z0R<
zHchNa>l*B8Bb#3C=RPn~A@b<~TsviM#aakEp|v(``l1n{Fl~>gb&b&F(qs7Ol9q?C
z1M;Y#K5eOCr$#6P_i`EjSKetBp}GAW*WP0JbWcBLaTAx?%BHmCLaQNV<Wv2KG`op4
z7{&C!Xvy``SLP_Ae9&A}(tqKm3Z1QGTwqkv`~BRz#!RZDkJB98=T3)?a2=CgZnIj!
zmG*PT%sECCjp*mNHQz|pPzZMnX_{e$C`J{yDM{{8XOU4$7b&iX4msBtaoXRn8v@HZ
zS~F2v-bL@2D~x)wCrPfCeq+uzng*raOeZF%b+z^=qj`{SWNI)=C#Fi%jWn9p8Y5}{
zv@~~!wi%=8wBmLa?04=oS_buNp|ATbJ=zW3_lkR;oz@Qig{7P%M)^3P812ScnPRlh
zlS~@#gc|>nq>Os4P>9oXoNQA2*Xbj+)UM(ZZ^vgVrwf%t(u^)vIPV;srsy|R#Lp3)
zSJQC>(CBAibUFaq=y#{o16nbBSjCK9*x=-X3r?Tn^_r#!Fs(hM(v>y?mWC<)hk!cH
zLFxZOaqqB_)L}?CZ9}>m{R3#$k8dG4PDL3y-V|AQ;XAa$Vb~<{Xeb1_R0|B@sF&EH
zaFW6q3NKZ-K;aT#9<?iawZgRuGpIdfm(yV|@=Y$Wg|*v_v|G`|w8EN#`{ZPACQxdN
zsems+kxNOvl8gZELzPRMqHqDb$$1vq&Df3g%Ceo^Ykda#m;7s5&3><CvsStp|M)bQ
zMtP|QG>>`BtcPXjCY_{rybIY$n#^a?D{#l~qLqPL6}Gb-_AGWKedV<QS6B<+XtTEr
z^uOR#YE|i8i4+6KWs0qIkl)C*FgZi5D)poA6T%zL^X_H4*&Et@DKsVmPh#t=``Cv{
zeHb~u$PO#{EBL&BiydKWocGu(^d!!dBh2^Cu*X@0=ks><x-*L{?N4s2CuuoDOI7%#
zYLwSulnv}UHOQmvdAEa4Vu3jm5kGWq;HlrT52%aFyn1-2a`X!F-A89Y-@(sN3e(uB
zoOY`5ouQxO0<)e@xCi)2_JQ}0e7%~F^=dvURme>$B!eHkM%Xz1CYN}UZ=oy9`!KNI
z;}G4X5?Y^9AuAP5Vqdyn@H1+<{={<iZ{b=_W@Z1>U2GL-4z#7fz4!=r*jM~5=CIjt
z>M&o6LH>|YuYE|;(pQ!~tJhJsK%DTvF_16C9qX{dU6hhJ-lM|rQo#yU)|G0kg{**Y
z(+b&Ma|dt*YouLjl=rBFU}@e7clG)<Z5PJ9NBcXB`yuTCdcydfc8^+u2j~+_{yoZ@
zw0sFRvf3V25g(?46mMg)Cb|Bk5<Szec*t#I&!{lZsLu6@uBY9+T3?Gja+=v>(-_^x
zjco$3oMr)Q6*egxp|qow_9B`BZ7a<H&W5&;JbKh<#Cz?sr_mJAyTA%M1+1elfx{J!
zRXAD6FQ#uGZ&Q*h6kbDNvyoQPcwmxdnj6_h1pB!}kv+0#{1fas_Bwl){V)5L<@0)e
z75`^`iZjj9hG`SD*R(>tTz7Ha5Lp@b8$|zY^cftNObzEwR4f}=R@lZD@NIlIKgO%H
zb=qd_KJC}qH(G`s7JElluqJVIWM1uF`7MGo?T4pH{{rXUU&@l=`;mECA3f2RfBrEe
zd-}4@xrrt1t1b@`OWWGl^_?0!(d-*};Z{wQO`9Q}o_bYk(PUae*U>d}18@oUKs&9X
z<rJlBDWDtCUJvOiS_|q%ND|m|Nzkik8GcJabwV1YtHDV+0c+`@QT=G-TxdI0gmbk6
zF>a*r4=%^RK^G09?!INy!e(gVmP@-fUB3F_hyP%W`to4kCw)I@y`T9Z%gR}jmFHj2
za*9i`>@2&ldDc66{lNc*;MGLMjHm!#eFc{h&1sv`_TI9!Uu_vPcj7Ncy*IAr`mr5-
S<JxT27hU)!>&u$=nf7NI7Fikq

delta 6375
zcmZu$3w%`7ng7nY?>jTe+zgo{Bq0;>V3J8f5~2i!N_Z4PLr^1_Aj(5n2t+Q-1O-Bz
zusjqC3cW~yr7r4<kNSX(&n<4n#h(=|RcqDtwc@ra;;v#@>uz_Y|8r&nNq>98{Ll9~
z-}jyGJnosH?^)LOEZey`*}@ch;m0TEQ2P0pMn-(BmgpJ?^ptQ<9Bl-jK75FRlIBFJ
zWG|Qzy#N8^;!$Y97GWy>U2M~=5aF2;Cm+ocR3FhYWmj>?e~`!z-oKitz-wYvbrB*H
zf`P}35KSLo(AIP>S=){Fz}0{VKG%5rS!}_D;Xs0CBL3CHmvp%|rrgs(2t}fE@fq|?
zB$_mcmE>A6cswF1CyhRsN>u9w_|vS&JI+g3vG+M22YRG35qP8W9I#N`%&NWn)JkZ7
zt(LJ7-XGN&MfIpuVmOgq*7rjcPyb%85t4jJK#%U9r<qFd9Ku*c4)4i<O`^f;HcPd}
zy^wnQ&C4$D;5}i;Q(D8VL*JfE2n-kA?IB_Z;+!!S?}-VbrpWuoEYq%7c>er(FV8A1
z4ArW%5pHb+OH?8eTUWyFND#VP<Xvy&7DYh&!v5HF!`vU>Rupmckm{)6`g+}R%e>uI
zvooY47d`*e8qXqL%r3;(o9(63w<89o)KL;+5zHRui>)$pb|70;7A~@W<~Bm=PmRh9
z?{}-gR<|a6h!wCP=oO>0!o5N7dwWXNR^7b}29=>&og$1VFxYX}&%?`m^I+d7s^}f`
z<$5pszqUfP8eIiJhIcG5pJjT*8GmF!@A}N)-ssF~Z&+r&cS~k9%j$n1a{;rW2prE>
zXqERuVIGV2N1eTl<#@-ka<ec|dMuMW0Vn9Frjr>R?w!eMVj-_ObeQGze-xU-*)Z>t
z@H;HGKagXfTYq-$-*GLd5M_H$4Uc%o?7~dmgPN()7BSAU_-$T(eo0bGu_an`Cd5_w
z@z0Pz&JN5Vilp5a#jMy|i-wSZk~UQaOh>C1O_j8%5*-Fp9>w0%wW>PJZH0qyT{Pvt
zI>LKKA%}2XFn$+$hcjfPfhgJD%lSp+zZQy%@=6}Xx`RthrJfo>RcqYx`~}7ATCb)c
zob!N2tD@M<ScI5EHHzes>`d>vf)aj2^ZE)Z7F-E!PK5e~>j}(<-J1=&#MPku;gA}O
z^6zy_o}OrfBykNOq&b>98-$4#TiSNioOZDSc~1$t)}IWA^jOGrboW{)-FD9^yqcfa
zyz2`qS+;k3VTE7JrW#MB<~?6nz@pxJg#}YPU>?Q(k5%5xd&a|+;$8<)H6K<vz|R9;
z*{W8VT#1&#OC?$qO|Q(a<@7vOQ`nm@B3gMp%&?-fSo8)^{=|GB)@{!?ICU3*DYxRY
zbz0>v@a`H>*syT0M9_|g5n-5)dS_?-@35^FLF!&E0B4mAzl*((M>J;PFmQNc2}Hdj
zU!M3Iud-+aEA*O+>PB=RfZ?dyM`OM4o*zIj$>>s;Czg48i)vV>_i|BjX*mYaiw%SV
z3NNWNO?Nr$c+UhOaaVZ$NTf_uqbh4~EqX+^%3)Z$;^3Hp0_1vEMXqhej16pU-R%+q
zZvyxXcO@D>Pqn=wrxY0&Itm!|ioo$I?`&ihbG=2yQC}g_3>l7LxU0Ooi|5#@VRbMT
zGu*iMU&WJ0{naQOLsr`{28{#E3UB_%;v|k+)D45RZQV_vNpu5z@jb?n<!vbL8psVb
z)r4h(qp!};%!`Mtdoygpfmq1MP)&8N)xK|qdkaKXPJ6&o>rb0G?S50Kf7Ni;LaMv#
zC`&XLyp3g}(P1pPe9tMVsJoDf-%J(W&4rPS3W2Criq>Tl|HANAlr+v*51T;RUMxIp
zn*1zPuDp<DIhw3PqDOez0Dx*Sn(7Ze%E(f`592V%cTqe0gZMSxf0X2u^@0u=;gA(8
zag3B($8v9lR8F>|@9lDvUPWnv)h8^?_|2x*T3S~()B^7i`^}IK?-?<Vj-7HK*Z<!_
z<@nr9-r>?>YqMbd``j(wd!;4Gt-@oVaXZ#gRv>zt;4-o@qPK%^w*gW`s2LOAY0@ev
z?zkY6OM9^CptXJptk#=p^VDpGGGoJqM0j>G-5;ZIx6=f{VCQ8znS))`zl~&ez~r)J
zcuk^gf$zgONz-LB<+K{^I`6r%(PjZw)-XF>;eA~eW_Nl<c~Q<?=vi*K7`t6&SHEk>
zcU648H=#VI^upE%SaNHG)O4$*TOC_qZF&9TZPtaAxf6~m#k<)qPwbNT6Ciem>S%L!
z;51?(6Vn$C1!9XWca_j(m`;Z4fvRe743N7)hEaoD2QMrKYh-S_<*xQJMn%|aZ}g~=
z<$n7@xRJ0`<z5Ndn8yoiG~{!9SQui1fY1hr)Y=S(oY-X$8;;}N4U2TuvtoG=nogGE
zh?rudct=N7;lMgQs^Nwa*x>rbm1gbjn%nM^yNLHp!7A#(4M=s1U{(Li1U8K>w#h}s
zpzdOw_38lA=rzz_yYBINqSd%^Jsd4&KlNUXmasbStLO-}*UPA=obXnFs01r`Vg_!Q
ze$Z{*@y?Y?F<7E`I4vgHkj-wR1Es0EYRR<O&4^5og5T_|sTh;j01jd0{ZZV@&_P~u
zM|j67Dv~t@t|fSM8l_d*I_;Kto%$;)lV-qFr%mdMhEBF7@QkE;Bt1>y0*U*j+*N(>
zFjL}5DS1jQ({<WnEE0WffvqI)5qk|Rx6zkLrc=Et0uNV(Xqr?XHJc%SiM|A`MCUf@
zMul~HT@jrpSwib@A6zG-%_;M+Pp7wJues3L^n|h9UYhRpG;A^`DJ^a3p+y&dK1Qsh
zPRnJ;B144Nd;&Y5w&}dN9rV3Ydxnb+8K%HzB)%epy(hJ^WI{(Rkx+q5t4R?l7U&|a
zWj>$2l-|N@XVAy|0aK@WNF|FD;h~bUQ)4njho`kg#xE!eQ}LXW$OwO!qn~=aV);SG
z_W_%VN^nSn^p)uyjYX4xGKDY;*H$6yGXyt|3MChk+;|!xxwX2`O{5qpEC>rC!Bvw|
z9He&<WGen@;XFtUDEL%N#~7^qootdir;o9z!2hGEs!nT+X5a&cq?3{%wMAvr1XD(N
z#w=j9)doCg%uxqi^s>2dQ47Spa^WJ^HwkzfpQ~Qg=b-OZeTyVUq@QE<4e$`<i-51N
z<-(gL{GYet!25N9i_D~GK9izZzBt@10<F{MFx6=<YXRP*2)scCd*2fBqmn)*vBMUU
zJGsEsrs(^U?Axt~6x$$YsKXlIPKgOF=o1qC*19B^9BUnLEbm2!-|~&XO{Q?S1;H4N
zl$D4{tmSQxrwaI#wFPuH+XkD%)(+sUzCFMX<tSI!_dwgJ3qPN;HNf#Q-95hhK`*p_
zu3k!C(-UekjJfSsuZ)QGvNbnp>EPRka5qct6uZRyCERbjpnFN>^lXZwL)NRRLYs>T
z&qiuvZ>uW3Cb_M|{HIins&L{W0^Q0_s|K|Ua7lhnwdlYAi!Yr%8k|gk4&wSNobJTp
z572HLO@e!dzs~}6PI9TVGiVxK_(FGt1+@%Xmgb(v-pHh7qf)v8Gh54~@6z1cdNN23
zy@ji@$gMyLVkdM}q_`SzA=-;qlF&VfH9w5LliWu72D>|(zQngp5%3=0`z)Ips!|+R
zPOva-NOK0)DNJf@O4n=@Xkqe?NpYK5K~l@7?PCSIl|I$WwaAdsm(WAFib7|8<Ez$6
z=x~}lsm-7gdN#$;-S(x>ok(-N#^vBXPjfHoO<F1aZ<;%+Pt(fjU0k_Eyg%zfN{*s4
zxG@U$kkz6^DTtem7}Fl>YOR8nNp34yMvy9L;uS)-hhEb=v>3fExvlgRoYoFWyN({3
zBrLa5u34_t4be3W<&yN!6k)oF8flr<K+EupgWw*d_1ai^QgXX;@3J;)jYB#%(hF%z
zAKeb!%aZ$)eW~pFD@!qSMmmlpMz`a1WV8ccxCbza_c+e1H>J@UBN*f~4QH89|Nrzs
zQ)pLmfp_7{E~h#v5j3M8Nt`3`hZ27!gMEU)oZg0Kh3){Y(!HQHTA3vs4N-f^x{{(b
zGSesFg44g@Rmw=v1GvUJR+kexrwMoGfhtZo;jYd*Q&*VWi#r0R^+-#h{h(PIPaqXe
zxqcPzfDF9KElOGp%U^8zJfKY#z#!F094E0!Vzb1nBz8z#2+XEVNw1c;PNJXMlV&kJ
z3`V@81&(9wW)1C=bOCi3Q>cLIeKUYUTR^$|dMcHYDk*6I-b3RhPLbHbZn9pYD(c1?
zu}WHYvOA4$KtImEqt)yaC6l$#YO9c4L*>3?HJS%~^=u>at2&*c*L;)MDVoe@&>L{a
z@Cp@yTO@X}q}j^m(WkyPV29BGN8P?9ppW3ZX_4v9Ly9isBIy>okKe+!F;S-$nffvK
z3F6)LKlb0Vee7SALrF9`0ynWv;}AP7)ej@b=h?$j{sw+4IKhsvrPf>Q4f;9Gjw6hG
zAG7CJfsc46J8reI#p&eM`2;O0v{;5;EJxXeQC71qImjmF_s{3Y*gx6xc@w)qpFznc
z_O88{zrsGF<y>U9ig!zQZy@V?=q%`s{4A|RF}tPfZaK=c^b=fAHqdYEo%|Gg+joF(
zkX6|rt5PZhZ<c`>{NOdg#`9OWz}NXUnxP-U@IJwjxj8BG+8{%gN^D}kxBs1=l|}n+
zHcUMO*P^7Q=>lG67>WgL0QfU}-?rGF_z7mQE8x^(j*<iUKWh2PX%d!>v~*aNip2}W
z2@b4)ybX7#hgniIyJg@55_ijBc{1x#Io3Ru%hxM;Y`dNWE@w5c7ju6=CIm};Gu&0F
z>y_OY_crApFz$PmN9h;ZbIJiZ5s%VGn1Tb+o3Q+6*oZavBqc?0o`j<|CRXNI<)}>J
zxWp&vUb~GQmtl^}&Q+4GqJ2DDU5B0WJ~QznaD{5(MpgqXrU}3biFFbiq_$CNr_&f{
zTc{CuCA2m8kvVxttHF!w31B{*1eVY{z!?1=I7Z^-5+_UfkLU}?+oa?=i8m6*ueB?v
z3YegA`X;ss!S0th2AA*~X)X2Q5_l;a&la#=b_ctgJ;I)0$Jt5t2X>~O={%pe^2hl*
z{A>O#FH&lhe^E>|sM<J+h`#mh!;$r-cAv&^vs7>-6?u<cT9h}5Pv`6T?fgYPOzBj*
zmAjS4lrNM&E8P3Tr6m;+^*5rk^dQ>QvmHmHIQ}j^5wC7+C_kbu!T~CNjMZ>y&~V(D
zbUB@-r|6OX`D1^p^-rGg13l23XkF9QH7h>#rd8eR`ZrF#L-E?CE%1EPn)|0u59+}W
zzpeS|)JJ=ow#~fai|3Ct?e1UJ`UvYUx$;A``ojMs;QXcnWERB_H_<kttJ|iu)xI0P
zVnyTQQ#bzZ^|_Bewq<yK)ohbxb;U1cxmD1SUB%(rfuGz{y7`mc_>``$nF~8t(oKmQ
p-T0CvHH*9OeHzdCGKx^Jf8p#n>(6NaM!}ca)Gz#d>mmG>{RM&oISc>*