Tiehua Mei's picture

Tiehua Mei

Mithas-01

https://github.com/Mithas-114

Mithas-114

AI & ML interests

None yet

Recent Activity

authored a paper 3 days ago

Entropy Ratio Clipping as a Soft Global Constraint for Stable Reinforcement Learning

authored a paper 3 days ago

GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment

authored a paper 3 days ago

ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation

View all activity

Organizations

None yet

Papers 4

arxiv:2605.28293

arxiv:2605.19577

arxiv:2512.05591

arxiv:2506.04015

models 0

None public yet

datasets 0

None public yet