wangclnlp

wangcl wangclnlp

Achievements

DeepSpeed-Chat-Extension DeepSpeed-Chat-Extension Public

This repo contains some extensions of deepspeed-chat for fine-tuning LLMs (SFT+RLHF).

Python 20 1
NiuTrans/Vision-LLM-Alignment NiuTrans/Vision-LLM-Alignment Public

This repository contains the code for SFT, RLHF, and DPO, designed for vision-based LLMs, including the LLaVA models and the LLaMA-3.2-vision models.

Python 115 9
NiuTrans/GRAM NiuTrans/GRAM Public

Code for ICML 2025 paper "GRAM: A Generative Foundation Reward Model for Reward Generalization"

Python 11 1
CSEM CSEM Public

Code for TASLP 2025 paper "Learning Evaluation Models from Large Language Models for Sequence Generation"

Python 3