← Repo Trendingalexzhang13/rlm
★ 5.1kPYTHONCHATBOT / AGENT
Buat apaLibrary untuk melatih model bahasa (LLM) menggunakan Reinforcement Learning from Human Feedback (RLHF) dan teknik RL lainnya di Python.
Cocok buatCocok buat peneliti dan engineer ML yang ingin bereksperimen dengan fine-tuning LLM pakai metode reinforcement learning.
Lihat di GitHub →