Jacob Hilton

Viittaukset

	Kaikki	2019 lähtien
Sitaatit	10427	10407
h-indeksi	12	11
i10-indeksi	13	11

6000

3000

1500

4500

2020202120222023202451 166 743 5691 3716

Yleisessä käytössä

Näytä kaikki

1 artikkeli

0 artikkelia

käytettävissä

ei käytettävissä

Perustuu rahoitusehtoihin

Seuraa

Jacob Hilton

Alignment Research Center

Vahvistettu sähköpostiosoite verkkotunnuksessa alignment.org - Kotisivu

reinforcement learning set theory


Nimike Lajittele sitaattien mukaan Lajittele vuoden mukaan Lajittele otsikon mukaan	Viittaukset Viittaukset	Vuosi
Training language models to follow instructions with human feedback L Ouyang, J Wu, X Jiang, D Almeida, C Wainwright, P Mishkin, C Zhang, ... Advances in Neural Information Processing Systems 35, 27730-27744, 2022	6481	2022
Training verifiers to solve math word problems K Cobbe, V Kosaraju, M Bavarian, M Chen, H Jun, L Kaiser, M Plappert, ... arXiv preprint arXiv:2110.14168, 2021	1122	2021
TruthfulQA: Measuring How Models Mimic Human Falsehoods S Lin, J Hilton, O Evans arXiv preprint arXiv:2109.07958, 2021	716	2021
WebGPT: Browser-assisted question-answering with human feedback R Nakano, J Hilton, S Balaji, J Wu, L Ouyang, C Kim, C Hesse, S Jain, ... arXiv preprint arXiv:2112.09332, 2021	702	2021
Leveraging procedural generation to benchmark reinforcement learning K Cobbe, C Hesse, J Hilton, J Schulman International conference on machine learning, 2048-2056, 2020	508	2020
ChatGPT: Optimizing language models for dialogue J Schulman, B Zoph, C Kim, J Hilton, J Menick, J Weng, JFC Uribe, ... OpenAI blog, 2022	373	2022
Phasic policy gradient KW Cobbe, J Hilton, O Klimov, J Schulman International Conference on Machine Learning, 2020-2027, 2021	157	2021
Scaling laws for reward model overoptimization L Gao, J Schulman, J Hilton International Conference on Machine Learning, 10835-10866, 2023	152	2023
Teaching Models to Express Their Uncertainty in Words S Lin, J Hilton, O Evans arXiv preprint arXiv:2205.14334, 2022	149	2022
Understanding RL Vision J Hilton, N Cammarata, S Carter, G Goh, C Olah Distill 5 (11), e29, 2020	23	2020
Batch size-invariance for policy optimization J Hilton, K Cobbe, J Schulman Advances in Neural Information Processing Systems 35, 17086-17098, 2022	12	2022
Topological Ramsey numbers and countable ordinals AE Caicedo, J Hilton Foundations of mathematics 690, 85-118, 2017	12	2017
The topological pigeonhole principle for ordinals J Hilton The Journal of Symbolic Logic 81 (2), 662-686, 2016	12	2016
Scaling laws for single-agent reinforcement learning J Hilton, J Tang, J Schulman arXiv preprint arXiv:2301.13442, 2023	5	2023
Combinatorics of countable ordinal topologies JH Hilton University of Leeds, 2016	3	2016
Any modification of Müller's Markov process is transient J Hilton, J Kramár
The Hex Factor: The NIST Hash Function Competition J Hilton

Järjestelmä ei voi suorittaa toimenpidettä nyt. Yritä myöhemmin uudelleen.

Artikkelit 1–17

Sitaatteja vuodessa

Päällekkäiset lähteet

Yhdistetyt sitaatit

Lisää muut kirjoittajatMuut kirjoittajat

Seuraa

Viittaukset