Qinqing Zheng

Cited by

	All	Since 2021
Citations	1741	1484
h-index	16	15
i10-index	20	20

760

380

190

570

2015201620172018201920202021202220232024202520266 46 49 61 42 49 69 100 205 339 747 22

Public access

View all

4 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Aditya GroverCo-founder & CTO, Inception | Prof, UCLA | PhD, StanfordVerified email at cs.ucla.edu
Amy ZhangAssistant Professor of Electrical and Computer Engineering at University of Texas at AustinVerified email at austin.utexas.edu
Yuandong TianCo-founder, Stealth StartupVerified email at recursive.com
Weijie SuAssociate Professor, University of PennsylvaniaVerified email at wharton.upenn.edu
Qi LongProfessor, University of PennsylvaniaVerified email at upenn.edu
Shuxiao ChenUniversity of PennsylvaniaVerified email at wharton.upenn.edu
Michael RabbatResearch Scientist, FAIR at MetaVerified email at fb.com
Sainbayar SukhbaatarFAIR team, Meta AIVerified email at meta.com
Lucas LehnertUniversity of SaskatchewanVerified email at usask.ca
Ricky Tian Qi ChenMetaVerified email at meta.com
Harshit SikchiResearch Scientist, OpenAIVerified email at openai.com
Scott NiekumAssociate Professor, University of Massachusetts AmherstVerified email at cs.umass.edu
Zihan DingPrinceton UniversityVerified email at princeton.edu
Brandon AmosMetaVerified email at fb.com
Mikael HenaffMetaVerified email at nyu.edu
neta shaulComputer Science PhD student, Weizmann Institute of ScienceVerified email at weizmann.ac.il
Matthew LeFacebook AI ResearchVerified email at meta.com
Devaansh GuptaUniversity of California, Los AngelesVerified email at ucla.edu
Siyan ZhaoUniversity of California Los AngelesVerified email at g.ucla.edu
Hanlin ZhuPh.D. student, University of California, BerkeleyVerified email at berkeley.edu

Qinqing Zheng

Inception

Verified email at inceptionlabs.ai - Homepage

Reinforcement Learning Diffusion Models


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Online decision transformer Q Zheng, A Zhang, A Grover International Conference on Machine Learning 162, 27042--27059, 2022	348	2022
The llama 4 herd: The beginning of a new era of natively multimodal ai innovation AI Meta https://ai. meta. com/blog/llama-4-multimodal-intelligence/, checked on 4 (7 …, 2025	249	2025
A convergent gradient descent algorithm for rank minimization and semidefinite programming from random linear measurements Q Zheng, J Lafferty Advances in Neural Information Processing Systems (NeurIPS), 109--117, 2015	238	2015
Convergence analysis for rectangular matrix completion using Burer-Monteiro factorization and gradient descent Q Zheng, J Lafferty arXiv preprint arXiv:1605.07051, 2016	208	2016
Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping L Lehnert, S Sukhbaatar, DJ Su, Q Zheng, P Mcvay, M Rabbat, Y Tian COLM 2024, 2024	93*	2024
Federated f-differential privacy Q Zheng, S Chen, Q Long, W Su AISTATS 2021, 2021	90	2021
Guided flows for generative modeling and decision making Q Zheng, M Le, N Shaul, Y Lipman, A Grover, RTQ Chen arXiv preprint arXiv:2311.13443, 2023	74	2023
d1: Scaling reasoning in diffusion large language models via reinforcement learning S Zhao, D Gupta, Q Zheng, A Grover NeurIPS 2025, 2025	64	2025
Dual RL: Unification and New Methods for Reinforcement and Imitation Learning H Sikchi, Q Zheng, A Zhang, S Niekum ICLR 2024, 2023	63*	2023
Diffusion world model: Future Modeling Beyond Step-by-Step Rollout for Offline Reinforcement Learning Z Ding, A Zhang, Y Tian, Q Zheng arXiv preprint arXiv:2402.03570, 2024	55*	2024
Dualformer: Controllable fast and slow thinking by learning with randomized reasoning traces DJ Su, S Sukhbaatar, M Rabbat, Y Tian, Q Zheng ICLR 2025, 2024	44	2024
Minimax Estimation for Personalized Federated Learning: An Alternative between FedAvg and Local Training? S Chen, Q Zheng, Q Long, WJ Su JMLR, 2023	43*	2023
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning DJ Su, H Zhu, Y Xu, J Jiao, Y Tian, Q Zheng ICML 2025, 2025	40	2025
Semi-supervised offline reinforcement learning with action-free trajectories Q Zheng, M Henaff, B Amos, A Grover ICML 2023, 2023	32	2023
Sharp Composition Bounds for Gaussian Differential Privacy via Edgeworth Expansion Q Zheng, J Dong, Q Long, WJ Su ICML 2020, 2020	27	2020
Interpolating convex and non-convex tensor decompositions via the subspace norm Q Zheng, R Tomioka NeurIPS 2015, 2015	18	2015
Latent state marginalization as a low-cost approach for improving exploration D Zhang, A Courville, Y Bengio, Q Zheng, A Zhang, RTQ Chen ICLR 2023, 2022	14	2022
Reliable conditioning of behavioral cloning for offline reinforcement learning T Nguyen, Q Zheng, A Grover arXiv preprint arXiv:2210.05158, 2022	11*	2022
Near-Optimal Confidence Sequences for Bounded Random Variables AK Kuchibhotla, Q Zheng ICML 2021, 2021	11	2021
Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback Q Zheng, M Henaff, A Zhang, A Grover, B Amos RLC 2025, 2024	10	2024

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors