Which evaluation framework is used ? #21

Open

opened

Which evaluation framework is used to reproduce the results on LiveCodeBench, MBPP+, HumanEval+ in the ReadMe?

Metadata

Assignees

No one assigned

Labels

No labels

No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests