Saurabh Kumar

Viittaukset

	Kaikki	2019 lähtien
Sitaatit	1673	1658
h-indeksi	9	9
i10-indeksi	8	8

560

280

140

420

201820192020202120222023202413 65 166 275 420 541 191

Yleisessä käytössä

Näytä kaikki

3 artikkelia

0 artikkelia

käytettävissä

ei käytettävissä

Perustuu rahoitusehtoihin

Muut kirjoittajat

Marc G. BellemareGoogle BrainVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Carles GeladaOpenAIVahvistettu sähköpostiosoite verkkotunnuksessa openai.com
Chelsea FinnStanford University, GoogleVahvistettu sähköpostiosoite verkkotunnuksessa cs.stanford.edu
Tianhe YuGoogle DeepMindVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Pablo Samuel CastroGoogleVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Ofir NachumOpenAIVahvistettu sähköpostiosoite verkkotunnuksessa openai.com
Jacob BuckmanPhD Student, MilaVahvistettu sähköpostiosoite verkkotunnuksessa mail.mcgill.ca
Robert DadashiGoogle DeepMindVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Himanshu SahniStudent at Georgia Institute of TechnologyVahvistettu sähköpostiosoite verkkotunnuksessa gatech.edu
Mark RowlandResearch Scientist, Google DeepMindVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Rémi MunosDeepMindVahvistettu sähköpostiosoite verkkotunnuksessa inria.fr
Will DabneyDeepMindVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Dale SchuurmansUniversity of Alberta, Google DeepMindVahvistettu sähköpostiosoite verkkotunnuksessa cs.ualberta.ca
Benjamin Van RoyStanford UniversityVahvistettu sähköpostiosoite verkkotunnuksessa stanford.edu
Larry HeckProfessor, Georgia Institute of TechnologyVahvistettu sähköpostiosoite verkkotunnuksessa ieee.org
Pararth ShahSenior Staff Software Engineer, GoogleVahvistettu sähköpostiosoite verkkotunnuksessa google.com
Dilek Hakkani-TurProfessor of Computer Science, Univ. Illinois Urbana-ChampaignVahvistettu sähköpostiosoite verkkotunnuksessa ieee.org
Junfeng WenAssistant Professor, Carleton UniversityVahvistettu sähköpostiosoite verkkotunnuksessa carleton.ca

Seuraa

Saurabh Kumar

Stanford

Vahvistettu sähköpostiosoite verkkotunnuksessa stanford.edu

Continual Learning Reinforcement Learning


Nimike Lajittele sitaattien mukaan Lajittele vuoden mukaan Lajittele otsikon mukaan	Viittaukset Viittaukset	Vuosi
Gradient surgery for multi-task learning T Yu, S Kumar, A Gupta, S Levine, K Hausman, C Finn Advances in Neural Information Processing Systems 33, 5824-5836, 2020	804	2020
Deepmdp: Learning continuous latent space models for representation learning C Gelada, S Kumar, J Buckman, O Nachum, MG Bellemare International conference on machine learning, 2170-2179, 2019	295	2019
Dopamine: A research framework for deep reinforcement learning PS Castro, S Moitra, C Gelada, S Kumar, MG Bellemare arXiv preprint arXiv:1812.06110, 2018	280	2018
Statistics and samples in distributional reinforcement learning M Rowland, R Dadashi, S Kumar, R Munos, MG Bellemare, W Dabney International Conference on Machine Learning, 5528-5536, 2019	90	2019
One solution is not all you need: Few-shot extrapolation via structured maxent rl S Kumar, A Kumar, S Levine, C Finn Advances in Neural Information Processing Systems 33, 8198-8210, 2020	79	2020
Federated control with hierarchical multi-agent deep reinforcement learning S Kumar, P Shah, D Hakkani-Tur, L Heck arXiv preprint arXiv:1712.08266, 2017	41	2017
Learning to compose skills H Sahni, S Kumar, F Tejani, C Isbell arXiv preprint arXiv:1711.11289, 2017	40	2017
Characterizing the gap between actor-critic and policy gradient J Wen, S Kumar, R Gummadi, D Schuurmans International Conference on Machine Learning, 11101-11111, 2021	16	2021
Maintaining Plasticity in Continual Learning via Regenerative Regularization S Kumar, H Marklund, B Van Roy arXiv preprint arXiv:2308.11958, 2023	9	2023
Continual learning as computationally constrained reinforcement learning S Kumar, H Marklund, A Rao, Y Zhu, HJ Jeon, Y Liu, B Van Roy arXiv preprint arXiv:2307.04345, 2023	7	2023
Multi-task reinforcement learning without interference T Yu, S Kumar, A Gupta, S Levine, K Hausman, C Finn Proc. Optim. Found. Reinforcement Learn. Workshop NeurIPS, 2019	6	2019
State space decomposition and subgoal creation for transfer in deep reinforcement learning H Sahni, S Kumar, F Tejani, Y Schroecker, C Isbell arXiv preprint arXiv:1705.08997, 2017	4	2017
Generalized policy updates for policy optimization S Kumar, R Dadashi, Z Ahmed, D Schuurmans, MG Bellemare NeurIPS 2019 Optimization Foundations for Reinforcement Learning Workshop, 2019	2	2019
A Parametric Class of Approximate Gradient Updates for Policy Optimization R Gummadi, S Kumar, J Wen, D Schuurmans International Conference on Machine Learning, 7998-8015, 2022		2022

Järjestelmä ei voi suorittaa toimenpidettä nyt. Yritä myöhemmin uudelleen.

Artikkelit 1–14

Sitaatteja vuodessa

Päällekkäiset lähteet

Yhdistetyt sitaatit

Lisää muut kirjoittajatMuut kirjoittajat

Seuraa

Viittaukset

Muut kirjoittajat