MINIBENCH

MiniBench 是TestBench的一个轻量子集，包含 50 个从 TestBench 中精心挑选的函数，并通过 Node.js 重构了测试框架以改善测试效率，用于快速评估 LLM 的单元测试生成能力。

测试环境 📦

Node 20.17.0 Python 3.11.3

💡 测试环境不需要保持严格一致

安装 📚

克隆仓库

git clone https://github.com/McDj26/MiniBench.git

安装依赖包

npm i

安装依赖库

pip install javalang

下载 java_project

👉https://drive.google.com/file/d/1syRdGJfvM7ZWlvEwuEBFrYDNrtw-NGzh/view?usp=sharing

配置文件 ⚙️

参考.env.example中的内容，创建一个.env文件，下面是各个配置项的说明：

配置项	说明	默认值	是否必须
filtered_result_directory	过滤结果保存路径（数据集保存路径）	./filter_stage/filtered_result.json	✔️
OPENAI_API_KEY	API Key	-	✔️
OPENAI_BASE_URL	API Base Url	-	✔️
OPENAI_MODEL	待测试模型名称	-	✔️
generate_count	每个函数生成的单元测试数量	5	✔️
testcases_directory	生成的单元测试保存路径	./generate_stage	✔️
java_project	执行测试的项目集合路径	./java_project	✔️
raw_files_directory	原始数据集	./source_files	❌
extracted_files_directory	粗略抽取的数据集保存路径	./extract_stage	❌
filter_record_directory	过滤记录保存路径	./filter_stage/filter_records.json	❌
verbose	是否打印详细过程	false	❌
use_repair	是否使用修复后的单元测试	true	❌

预设命令 🧰

生成单元测试

npm run generate

修复单元测试

npm run repair

执行测试

npm run benchmark

测试结果保存路径：

${testcases_directory}/${OPENAI_MODEL}[-repair]/metrics.json
${testcases_directory}/${OPENAI_MODEL}[-repair]/test_record.json

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
filter_stage		filter_stage
generate_stage		generate_stage
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.en.md		README.en.md
README.md		README.md
TaskManager.js		TaskManager.js
benchmark.js		benchmark.js
clean.js		clean.js
evaluate_java_code.py		evaluate_java_code.py
extract.js		extract.js
filter.js		filter.js
generate.js		generate.js
lock.js		lock.js
logging.js		logging.js
package-lock.json		package-lock.json
package.json		package.json
repair.js		repair.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MINIBENCH

测试环境 📦

安装 📚

配置文件 ⚙️

预设命令 🧰

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

McDj26/MiniBench

Folders and files

Latest commit

History

Repository files navigation

MINIBENCH

测试环境 📦

安装 📚

配置文件 ⚙️

预设命令 🧰

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages