update for new cuda stream API

unixpickle · unixpickle · commit 720179385fe7 · 2017-03-29T13:44:30.000-04:00
diff --git a/mapper32.go b/mapper32.go
@@ -69,7 +69,7 @@ func (m *mapper32) Map(in, out anyvec.Vector) {
 		}
 		grid, block := out32.kernelSizes()
 		return m.creator.Handle.kernels32.Launch("mapForward", grid, 1, 1, block, 1, 1,
-			0, out32.buffer, in32.buffer, m.table, m.outSize)
+			0, nil, out32.buffer, in32.buffer, m.table, m.outSize)
 	})
 }
 
@@ -89,6 +89,6 @@ func (m *mapper32) MapTranspose(in, out anyvec.Vector) {
 		}
 		grid, block := in32.kernelSizes()
 		return m.creator.Handle.kernels32.Launch("mapBackward", grid, 1, 1, block, 1, 1,
-			0, out32.buffer, in32.buffer, m.table, m.outSize)
+			0, nil, out32.buffer, in32.buffer, m.table, m.outSize)
 	})
 }
diff --git a/vector32.go b/vector32.go
@@ -142,7 +142,7 @@ func (v *vector32) AddScaler(s anyvec.Numeric) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("addScaler", grid, 1, 1,
-			block, 1, 1, 0, scaler, v.buffer, v.Len())
+			block, 1, 1, 0, nil, scaler, v.buffer, v.Len())
 	})
 }
 
@@ -191,7 +191,7 @@ func (v *vector32) Div(other anyvec.Vector) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("divElements", grid, 1, 1,
-			block, 1, 1, 0, v.buffer, v1.buffer, v.Len())
+			block, 1, 1, 0, nil, v.buffer, v1.buffer, v.Len())
 	})
 }
 
diff --git a/vector32_extra.go b/vector32_extra.go
@@ -39,7 +39,7 @@ func (v *vector32) unaryOp(kernel string) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,
-			0, v.buffer, v.Len())
+			0, nil, v.buffer, v.Len())
 	})
 }
 
@@ -80,7 +80,7 @@ func (v *vector32) AddChunks(other anyvec.Vector) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("addChunks", grid, 1, 1, block, 1, 1,
-			0, v.buffer, v1.buffer, v.Len(), v.Len()/v1.Len())
+			0, nil, v.buffer, v1.buffer, v.Len(), v.Len()/v1.Len())
 	})
 }
 
@@ -107,7 +107,7 @@ func (v *vector32) randUniform() {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("shiftRandUniform", grid, 1, 1,
-			block, 1, 1, 0, v.buffer, v.Len())
+			block, 1, 1, 0, nil, v.buffer, v.Len())
 	})
 }
 
@@ -121,7 +121,7 @@ func (v *vector32) randBernoulli() {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("uniformToBernoulli", grid, 1, 1,
-			block, 1, 1, 0, v.buffer, v.Len())
+			block, 1, 1, 0, nil, v.buffer, v.Len())
 	})
 }
 
@@ -166,10 +166,10 @@ func (v *vector32) repeatedOp(kernel string, v1 *vector32) {
 		if isPowerOf2(v1.Len()) {
 			kernel += "Pow2"
 			return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,
-				0, v.buffer, v1.buffer, v.Len(), v1.Len()-1)
+				0, nil, v.buffer, v1.buffer, v.Len(), v1.Len()-1)
 		} else {
 			return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,
-				0, v.buffer, v1.buffer, v.Len(), v1.Len())
+				0, nil, v.buffer, v1.buffer, v.Len(), v1.Len())
 		}
 	})
 }
@@ -237,7 +237,7 @@ func (v *vector32) compare(kernel string, alpha float32) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,
-			0, alpha, v.buffer, v.Len())
+			0, nil, alpha, v.buffer, v.Len())
 	})
 }
 
@@ -302,7 +302,7 @@ func (v *vector32) addLogsKernel(rows, cols int, dst, src cuda.Buffer, threads i
 	}
 	sharedSize := 4 * uint(threads)
 	return v.creator.Handle.kernels32.Launch("addLogs", uint(rows), grid, 1,
-		uint(threads), 1, 1, sharedSize, dst, src, uint(cols))
+		uint(threads), 1, 1, sharedSize, nil, dst, src, uint(cols))
 }
 
 func (v *vector32) ElemMax(other anyvec.Vector) {
@@ -314,7 +314,7 @@ func (v *vector32) ElemMax(other anyvec.Vector) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("elemMax", grid, 1, 1, block, 1, 1,
-			0, v.buffer, v1.buffer, v.Len())
+			0, nil, v.buffer, v1.buffer, v.Len())
 	})
 }
 
@@ -343,7 +343,7 @@ func (v *vector32) LogSoftmax(chunkSize int) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("subChunks", grid, 1, 1,
-			block, 1, 1, 0, v.buffer, tmp, v.Len(), chunkSize)
+			block, 1, 1, 0, nil, v.buffer, tmp, v.Len(), chunkSize)
 	})
 }
 
@@ -358,7 +358,7 @@ func (v *vector32) Pow(n anyvec.Numeric) {
 		}
 		grid, block := v.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("powScaler", grid, 1, 1,
-			block, 1, 1, 0, scaler, v.buffer, v.Len())
+			block, 1, 1, 0, nil, scaler, v.buffer, v.Len())
 	})
 }
 
@@ -385,7 +385,7 @@ func (v *vector32) MapMax(cols int) anyvec.Mapper {
 		dummyVec := &vector32{size: rows}
 		grid, block := dummyVec.kernelSizes()
 		return v.creator.Handle.kernels32.Launch("mapMax", grid, 1, 1, block, 1, 1,
-			0, buf, v.buffer, rows, cols)
+			0, nil, buf, v.buffer, rows, cols)
 	})
 	return res
 }
@@ -412,7 +412,7 @@ func (v *vector32) SumRows(cols int) anyvec.Vector {
 		dummy := vector32{size: rows}
 		grid, block := dummy.kernelSizes()
 		err = v.creator.Handle.kernels32.Launch("setScaler", grid, 1, 1,
-			block, 1, 1, 0, float32(1), ones, rows)
+			block, 1, 1, 0, nil, float32(1), ones, rows)
 		if err != nil {
 			return err
 		}

Original file line number	Diff line number	Diff line change
`@@ -69,7 +69,7 @@ func (m *mapper32) Map(in, out anyvec.Vector) {`
`69`	`69`	`}`
`70`	`70`	`grid, block := out32.kernelSizes()`
`71`	`71`	`return m.creator.Handle.kernels32.Launch("mapForward", grid, 1, 1, block, 1, 1,`
`72`		`- 0, out32.buffer, in32.buffer, m.table, m.outSize)`
	`72`	`+ 0, nil, out32.buffer, in32.buffer, m.table, m.outSize)`
`73`	`73`	`})`
`74`	`74`	`}`
`75`	`75`
`@@ -89,6 +89,6 @@ func (m *mapper32) MapTranspose(in, out anyvec.Vector) {`
`89`	`89`	`}`
`90`	`90`	`grid, block := in32.kernelSizes()`
`91`	`91`	`return m.creator.Handle.kernels32.Launch("mapBackward", grid, 1, 1, block, 1, 1,`
`92`		`- 0, out32.buffer, in32.buffer, m.table, m.outSize)`
	`92`	`+ 0, nil, out32.buffer, in32.buffer, m.table, m.outSize)`
`93`	`93`	`})`
`94`	`94`	`}`
Original file line number	Diff line number	Diff line change
`@@ -142,7 +142,7 @@ func (v *vector32) AddScaler(s anyvec.Numeric) {`
`142`	`142`	`}`
`143`	`143`	`grid, block := v.kernelSizes()`
`144`	`144`	`return v.creator.Handle.kernels32.Launch("addScaler", grid, 1, 1,`
`145`		`- block, 1, 1, 0, scaler, v.buffer, v.Len())`
	`145`	`+ block, 1, 1, 0, nil, scaler, v.buffer, v.Len())`
`146`	`146`	`})`
`147`	`147`	`}`
`148`	`148`
`@@ -191,7 +191,7 @@ func (v *vector32) Div(other anyvec.Vector) {`
`191`	`191`	`}`
`192`	`192`	`grid, block := v.kernelSizes()`
`193`	`193`	`return v.creator.Handle.kernels32.Launch("divElements", grid, 1, 1,`
`194`		`- block, 1, 1, 0, v.buffer, v1.buffer, v.Len())`
	`194`	`+ block, 1, 1, 0, nil, v.buffer, v1.buffer, v.Len())`
`195`	`195`	`})`
`196`	`196`	`}`
`197`	`197`
Original file line number	Diff line number	Diff line change
`@@ -39,7 +39,7 @@ func (v *vector32) unaryOp(kernel string) {`
`39`	`39`	`}`
`40`	`40`	`grid, block := v.kernelSizes()`
`41`	`41`	`return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,`
`42`		`- 0, v.buffer, v.Len())`
	`42`	`+ 0, nil, v.buffer, v.Len())`
`43`	`43`	`})`
`44`	`44`	`}`
`45`	`45`
`@@ -80,7 +80,7 @@ func (v *vector32) AddChunks(other anyvec.Vector) {`
`80`	`80`	`}`
`81`	`81`	`grid, block := v.kernelSizes()`
`82`	`82`	`return v.creator.Handle.kernels32.Launch("addChunks", grid, 1, 1, block, 1, 1,`
`83`		`- 0, v.buffer, v1.buffer, v.Len(), v.Len()/v1.Len())`
	`83`	`+ 0, nil, v.buffer, v1.buffer, v.Len(), v.Len()/v1.Len())`
`84`	`84`	`})`
`85`	`85`	`}`
`86`	`86`
`@@ -107,7 +107,7 @@ func (v *vector32) randUniform() {`
`107`	`107`	`}`
`108`	`108`	`grid, block := v.kernelSizes()`
`109`	`109`	`return v.creator.Handle.kernels32.Launch("shiftRandUniform", grid, 1, 1,`
`110`		`- block, 1, 1, 0, v.buffer, v.Len())`
	`110`	`+ block, 1, 1, 0, nil, v.buffer, v.Len())`
`111`	`111`	`})`
`112`	`112`	`}`
`113`	`113`
`@@ -121,7 +121,7 @@ func (v *vector32) randBernoulli() {`
`121`	`121`	`}`
`122`	`122`	`grid, block := v.kernelSizes()`
`123`	`123`	`return v.creator.Handle.kernels32.Launch("uniformToBernoulli", grid, 1, 1,`
`124`		`- block, 1, 1, 0, v.buffer, v.Len())`
	`124`	`+ block, 1, 1, 0, nil, v.buffer, v.Len())`
`125`	`125`	`})`
`126`	`126`	`}`
`127`	`127`
`@@ -166,10 +166,10 @@ func (v vector32) repeatedOp(kernel string, v1 vector32) {`
`166`	`166`	`if isPowerOf2(v1.Len()) {`
`167`	`167`	`kernel += "Pow2"`
`168`	`168`	`return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,`
`169`		`- 0, v.buffer, v1.buffer, v.Len(), v1.Len()-1)`
	`169`	`+ 0, nil, v.buffer, v1.buffer, v.Len(), v1.Len()-1)`
`170`	`170`	`} else {`
`171`	`171`	`return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,`
`172`		`- 0, v.buffer, v1.buffer, v.Len(), v1.Len())`
	`172`	`+ 0, nil, v.buffer, v1.buffer, v.Len(), v1.Len())`
`173`	`173`	`}`
`174`	`174`	`})`
`175`	`175`	`}`
`@@ -237,7 +237,7 @@ func (v *vector32) compare(kernel string, alpha float32) {`
`237`	`237`	`}`
`238`	`238`	`grid, block := v.kernelSizes()`
`239`	`239`	`return v.creator.Handle.kernels32.Launch(kernel, grid, 1, 1, block, 1, 1,`
`240`		`- 0, alpha, v.buffer, v.Len())`
	`240`	`+ 0, nil, alpha, v.buffer, v.Len())`
`241`	`241`	`})`
`242`	`242`	`}`
`243`	`243`
`@@ -302,7 +302,7 @@ func (v *vector32) addLogsKernel(rows, cols int, dst, src cuda.Buffer, threads i`
`302`	`302`	`}`
`303`	`303`	`sharedSize := 4 * uint(threads)`
`304`	`304`	`return v.creator.Handle.kernels32.Launch("addLogs", uint(rows), grid, 1,`
`305`		`- uint(threads), 1, 1, sharedSize, dst, src, uint(cols))`
	`305`	`+ uint(threads), 1, 1, sharedSize, nil, dst, src, uint(cols))`
`306`	`306`	`}`
`307`	`307`
`308`	`308`	`func (v *vector32) ElemMax(other anyvec.Vector) {`
`@@ -314,7 +314,7 @@ func (v *vector32) ElemMax(other anyvec.Vector) {`
`314`	`314`	`}`
`315`	`315`	`grid, block := v.kernelSizes()`
`316`	`316`	`return v.creator.Handle.kernels32.Launch("elemMax", grid, 1, 1, block, 1, 1,`
`317`		`- 0, v.buffer, v1.buffer, v.Len())`
	`317`	`+ 0, nil, v.buffer, v1.buffer, v.Len())`
`318`	`318`	`})`
`319`	`319`	`}`
`320`	`320`
`@@ -343,7 +343,7 @@ func (v *vector32) LogSoftmax(chunkSize int) {`
`343`	`343`	`}`
`344`	`344`	`grid, block := v.kernelSizes()`
`345`	`345`	`return v.creator.Handle.kernels32.Launch("subChunks", grid, 1, 1,`
`346`		`- block, 1, 1, 0, v.buffer, tmp, v.Len(), chunkSize)`
	`346`	`+ block, 1, 1, 0, nil, v.buffer, tmp, v.Len(), chunkSize)`
`347`	`347`	`})`
`348`	`348`	`}`
`349`	`349`
`@@ -358,7 +358,7 @@ func (v *vector32) Pow(n anyvec.Numeric) {`
`358`	`358`	`}`
`359`	`359`	`grid, block := v.kernelSizes()`
`360`	`360`	`return v.creator.Handle.kernels32.Launch("powScaler", grid, 1, 1,`
`361`		`- block, 1, 1, 0, scaler, v.buffer, v.Len())`
	`361`	`+ block, 1, 1, 0, nil, scaler, v.buffer, v.Len())`
`362`	`362`	`})`
`363`	`363`	`}`
`364`	`364`
`@@ -385,7 +385,7 @@ func (v *vector32) MapMax(cols int) anyvec.Mapper {`
`385`	`385`	`dummyVec := &vector32{size: rows}`
`386`	`386`	`grid, block := dummyVec.kernelSizes()`
`387`	`387`	`return v.creator.Handle.kernels32.Launch("mapMax", grid, 1, 1, block, 1, 1,`
`388`		`- 0, buf, v.buffer, rows, cols)`
	`388`	`+ 0, nil, buf, v.buffer, rows, cols)`
`389`	`389`	`})`
`390`	`390`	`return res`
`391`	`391`	`}`
`@@ -412,7 +412,7 @@ func (v *vector32) SumRows(cols int) anyvec.Vector {`
`412`	`412`	`dummy := vector32{size: rows}`
`413`	`413`	`grid, block := dummy.kernelSizes()`
`414`	`414`	`err = v.creator.Handle.kernels32.Launch("setScaler", grid, 1, 1,`
`415`		`- block, 1, 1, 0, float32(1), ones, rows)`
	`415`	`+ block, 1, 1, 0, nil, float32(1), ones, rows)`
`416`	`416`	`if err != nil {`
`417`	`417`	`return err`
`418`	`418`	`}`