Releases · rdnfn/feedback-forensics · GitHub

20 Nov 16:02

rdnfn

v0.4.7 Latest

Latest

What's Changed

Various improvements by @rdnfn in #72
- Fixes to testing (pin to Python 3.13)
- New experimental notebooks and configurations (human etc.)
- Fixing issues in plotting
- Add new models to ff-model-personality config
Update README with paper release information by @rdnfn in #71

Full Changelog: v0.4.6...v0.4.7

Contributors

rdnfn

Assets 2

07 Aug 20:58

rdnfn

v0.4.6

What's Changed

Add model personality comparison dataset to web app by @rdnfn in #69
Add filter of "nan" and empty value comparisons (as these can distort results) by @rdnfn in #69
Add new models to model comparison config (gpt-oss-20b, gpt-5) by @rdnfn in #69
Fix issue with example links in app (new arena dataset name with year) @rdnfn in #70

Full Changelog: v0.4.5...v0.4.6

Contributors

rdnfn

Assets 2

03 Aug 11:05

rdnfn

v0.4.5

What's Changed

Improve data loading by @rdnfn in #68
- Breaking change: Due to changes in the underlying loading mechanism, -d no longer accepts the older ICAI results format of folders (rather than AP json files)
- Add support for loading multiple datasets by providing directory alone (via --dir CLI argument)
- Add support for specifying multiple datasets via -d/--datapath rather than just a single one
- Add support for specifying dataset metadata (name, description, etc.) inside AnnotatedPairs json, rather than separately inside package
- Add support for loading pre-annotated results from HuggingFace (without token) via --load-web-datasets CLI flag (dataset link)

Full Changelog: v0.4.4...v0.4.5

Contributors

rdnfn

Assets 2

31 Jul 12:11

rdnfn

v0.4.4

What's Changed

Add Python CLI for model comparison
Add GitHub action for automatic addition of new model to HuggingFace dataset
Add advanced tutorials to docs
- Correlation analysis
- Confidence intervals

Full Changelog: v0.4.3...v0.4.4

Assets 2

03 Jul 18:06

rdnfn

v0.4.3

What's Changed

Improvements to results presentation reducing clutter (by @rdnfn in #60)
- Make metrics shown configurable via env var, and reduce default number of shown metrics
- Hide prompt in example viewer if none available
Improvement to docs:
- Add method figure to docs and README by @rdnfn in #58
- Add metrics docs by @rdnfn in #59

Full Changelog: v0.4.2...v0.4.3

Contributors

rdnfn

Assets 2

05 Jun 14:38

rdnfn

v0.4.2

What's Changed

Update model annotator name by @rdnfn in #51
Update README.md by @rdnfn in #52
Fix interface issues and improve docs by @rdnfn in #53

Full Changelog: v0.4.1...v0.4.2

Contributors

rdnfn

Assets 2

31 May 21:59

rdnfn

v0.4.1

What's Changed

Add ff-data tool with merge support by @timokau in #45
Add ff-data csv_to_ap tool to convert csv to ap by @timokau in #48
Improvements to docs by @rdnfn in #43, #44, #47

Full Changelog: v0.4.0...v0.4.1

Contributors

timokau and rdnfn

Assets 2

28 May 21:38

rdnfn

v0.4.0

What's Changed

Add simplified settings view in addition to advanced settings making app easier to use, by @rdnfn in #41
Add new datapoint viewer (experimental) by @rdnfn in #41

Full Changelog: v0.3.2...v0.4.0

Contributors

rdnfn

Assets 2

20 May 15:18

rdnfn

v0.3.2

What's Changed

Revert change of special arena dataset source by @rdnfn in #40

Full Changelog: v0.3.1...v0.3.2

Contributors

rdnfn

Assets 2

20 May 14:32

rdnfn

v0.3.1

What's Changed

Fixes and dataset improvements by @rdnfn in #37
- Fix reference model setting (on already loaded datasets)
- Update datasets available in online interface

Full Changelog: v0.3.0...v0.3.1

Contributors

rdnfn

Assets 2