raymondng76

🥺

Raymond raymondng76

🥺

38 followers · 96 following

AI Singapore
Singapore

Achievements

Stars

Dataset and Benchmark

20 repositories

reddy-lab-code-research / XLCoST

Code and data for XLCoST: A Benchmark Dataset for Cross-lingual Code Intelligence

C 68 3 Updated Jan 21, 2025

google-deepmind / code_contests

C++ 2,120 213 Updated Oct 3, 2023

Alex-Fabbri / Multi-News

Large-scale multi-document summarization dataset and code

Python 282 52 Updated May 8, 2023

ryanzhumich / AESLC

Annotated Enron Subject Line Corpus (AESLC)

25 9 Updated Feb 2, 2023

mcdm / CommitmentBank

Materials related to our Sinn und Bedeutung 23 paper

R 38 11 Updated May 28, 2020

facebookresearch / XNLI

Evaluating Cross-lingual Sentence Representations

449 44 Updated Aug 30, 2021

Wikidepia / indonesian_datasets

NLP Datasets for Indonesian

Python 112 13 Updated Feb 11, 2023

IndoNLP / nusa-catalogue

Dataset Catalogue Homepage for Indonesian Languages

JavaScript 7 8 Updated Feb 19, 2024

hendrycks / test

Measuring Massive Multitask Language Understanding | ICLR 2021

Python 1,330 100 Updated May 28, 2023

facebookresearch / flores

Facebook Low Resource (FLoRes) MT Benchmark

Python 722 125 Updated Nov 20, 2023

allenai / natural-instructions

Expanding natural instructions

Python 980 191 Updated Dec 11, 2023

Yale-LILY / FOLIO

117 9 Updated Dec 22, 2023

anthropics / hh-rlhf

Human preference data for "Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback"

1,694 137 Updated Sep 19, 2023

asappresearch / abcd

Official repository for "Action-Based Conversations Dataset: A Corpus for Building More In-Depth Task-Oriented Dialogue Systems"

Python 69 27 Updated Jan 26, 2022

lgdbdumps / lgdbdumps

Library Genesis (libgen) db dumps mirror on ipfs

HTML 47 1 Updated Jul 2, 2024

PolyAI-LDN / conversational-datasets

Large datasets for conversational AI

Python 1,325 173 Updated Nov 16, 2019

LLM360 / amber-data-prep

Data preparation code for Amber 7B LLM

Python 85 10 Updated May 10, 2024

joanitolopo / bhinneka-korpus

Bhinneka Korpus: A Collection of Multilingual Parallel Datasets for 5 Indonesian Local Languages

1 Updated Dec 21, 2023

FlareSolverr / FlareSolverr

Proxy server to bypass Cloudflare protection

Python 8,808 752 Updated Mar 4, 2025

project-miracl / miracl

A large-scale multilingual dataset for Information Retrieval. Thorough human-annotations across 18 diverse languages.

176 4 Updated Jul 31, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Raymond raymondng76

Achievements

Achievements

Block or report raymondng76

Dataset and Benchmark

reddy-lab-code-research / XLCoST

google-deepmind / code_contests

Alex-Fabbri / Multi-News

ryanzhumich / AESLC

mcdm / CommitmentBank

facebookresearch / XNLI

Wikidepia / indonesian_datasets

IndoNLP / nusa-catalogue

hendrycks / test

facebookresearch / flores

allenai / natural-instructions

Yale-LILY / FOLIO

anthropics / hh-rlhf

asappresearch / abcd

lgdbdumps / lgdbdumps

PolyAI-LDN / conversational-datasets

LLM360 / amber-data-prep

joanitolopo / bhinneka-korpus

FlareSolverr / FlareSolverr

project-miracl / miracl