#

rl-training

Here are 6 public repositories matching this topic...

rohithreddy024 / Text-Summarizer-Pytorch

Pytorch implementation of "A Deep Reinforced Model for Abstractive Summarization" paper and pointer generator network

pytorch text-summarization beam-search rl-training mle-training

Updated Oct 1, 2019
Python

zli12321 / qa_metrics

An easy python package to run quick basic QA evaluations. This package includes standardized QA evaluation metrics and semantic evaluation metrics: Black-box and Open-Source large language model prompting and evaluation, exact match, F1 Score, PEDANT semantic match, transformer match. Our package also supports prompting OPENAI and Anthropic API.

qa-automation-test rl-training llm exact-matching llm-evaluation llm-evaluation-toolkit llm-evaluation-framework reward-modeling

Updated Jul 18, 2025
Python

sb-ai-lab / Sim4Rec

Simulator for training and evaluation of Recommender Systems

recommender-system recommendation user-modeling evaluation-framework synthetic-data rl-training

Updated Mar 24, 2025
Jupyter Notebook

zli12321 / free-form-grpo

grpo to train long form QA and instructions with long-form reward model

reinforcement-learning-algorithms evaluation-framework reward-design rl-training long-form-text-generation qwen2-5 grpo rlvr

Updated Jul 17, 2025
Python

Amirhosein-gh98 / Guided-by-Gut

The official PyTorch implementation for the Guided by Gut: Efficient Test-Time Scaling with Reinforced Intrinsic Confidence

efficient tree-search gg prm self-consistency confidence dvts rl-training llm inference-time-compute grpo test-time-scaling guided-by-gut

Updated Jun 9, 2025
Python

sotheara-leang / txt-summarization

Deep Reinforced Model for Abstractive Summarization

pytorch text-summarization abstractive-summarization rl-training mle-training temporal-attention share-decoder-weight

Updated Nov 22, 2022
Python

Improve this page

Add a description, image, and links to the rl-training topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the rl-training topic, visit your repo's landing page and select "manage topics."