Add accelerate workloads

kusumachalasani · kusumachalasani · commit 8686a41739de · 2024-10-15T01:20:25.000+05:30
Signed-off-by: kusumachalasani &lt;kchalasa@redhat.com&gt;
diff --git a/common/common_helper.sh b/common/common_helper.sh
@@ -311,33 +311,33 @@ function benchmarks_install() {
 
 		if [ ${GPUS} -gt 0 ];then
 			num_gpus=$((GPUS))
-			# Commenting for now
-			#if [ ${num_gpus} > 0 ]; then
-			#	echo "#######################################"
-			#	echo "Running HumanEval benchmark job in background"
-			#	echo
-			#	pushd AI-MLbenchmarks/human-eval >/dev/null
-			#	./deploy.sh ${NAMESPACE}
-			#	check_err "ERROR: Human eval job failed to start, exiting"
-			#	popd >/dev/null
-			#	num_gpus=$((num_gpus - 1))
-			#fi
+			if [ ${num_gpus} -gt 0 ]; then
+				echo "#######################################"
+				echo "Running HumanEval benchmark job in background"
+				echo
+				pushd human-eval-benchmark/manifests >/dev/null
+				sed -i 's/namespace: kruize-hackathon/namespace: "'"${NAMESPACE}"'"/' pvc.yaml
+				sed -i 's/namespace: kruize-hackathon/namespace: "'"${NAMESPACE}"'"/' job.yaml
+				oc apply -f pvc.yaml -n ${NAMESPACE}
+				oc apply -f job.yaml -n ${NAMESPACE}
+				check_err "ERROR: Human eval job failed to start, exiting"
+				popd >/dev/null
+				num_gpus=$((num_gpus - 1))
+			fi
 
 			if [ ${num_gpus} -gt 0 ]; then
 				echo "#######################################"
                                 echo "Running Training TTM benchmark job in background"
-				echo
                                 pushd AI-MLbenchmarks/ttm >/dev/null
 				echo ""
-                                #./run_ttm.sh ${NAMESPACE} >> ${LOG_FILE} &
+                                ./run_ttm.sh ${NAMESPACE} >> ${LOG_FILE} &
                                 check_err "ERROR: Training ttm jobs failed to start, exiting"
 				popd >/dev/null
                                 num_gpus=$((num_gpus - 1))
                         fi
 			if [ ${num_gpus} -gt 0 ]; then
 				echo "#######################################"
 				echo "Installing LLM-RAG benchmark into cluster"
-				echo
 				pushd AI-MLbenchmarks/llm-rag >/dev/null
 				./deploy.sh ${NAMESPACE}
 				check_err "ERROR: llm-rag benchmark failed to start, exiting"
diff --git a/monitoring/local_monitoring/create_human_eval_exp.json b/monitoring/local_monitoring/create_human_eval_exp.json
@@ -9,12 +9,12 @@
   "kubernetes_objects": [
     {
       "type": "job",
-      "name": "human-eval",
+      "name": "human-eval-deployment-job",
       "namespace": "default",
       "containers": [
         {
-          "container_image_name": "kruizehub/human-eval",
-          "container_name": "human-eval"
+          "container_image_name": "kruizehub/human-eval-deployment:latest",
+          "container_name": "human-eval-benchmark"
         }
       ]
     }

Original file line number	Diff line number	Diff line change
`@@ -9,12 +9,12 @@`
`9`	`9`	`"kubernetes_objects": [`
`10`	`10`	`{`
`11`	`11`	`"type": "job",`
`12`		`- "name": "human-eval",`
	`12`	`+ "name": "human-eval-deployment-job",`
`13`	`13`	`"namespace": "default",`
`14`	`14`	`"containers": [`
`15`	`15`	`{`
`16`		`- "container_image_name": "kruizehub/human-eval",`
`17`		`- "container_name": "human-eval"`
	`16`	`+ "container_image_name": "kruizehub/human-eval-deployment:latest",`
	`17`	`+ "container_name": "human-eval-benchmark"`
`18`	`18`	`}`
`19`	`19`	`]`
`20`	`20`	`}`