Esin Durmus

Cited by

	All	Since 2021
Citations	18404	18285
h-index	35	34
i10-index	47	46

9000

4500

2250

6750

202020212022202320242025202659 246 863 2613 5691 8445 317

Public access

View all

11 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Faisal LadhakNvidiaVerified email at nvidia.com
Rishi BommasaniCS PhD, Stanford UniversityVerified email at stanford.edu
Tatsunori HashimotoAssistant Professor, StanfordVerified email at stanford.edu
Deep GanguliAnthropicVerified email at cns.nyu.edu
Claire CardieProfessor of Computer Science, Cornell UniversityVerified email at cs.cornell.edu
Alex TamkinMember of Technical Staff, AnthropicVerified email at cs.stanford.edu
Dan JurafskyProfessor of Linguistics and Computer Science, Stanford UniversityVerified email at stanford.edu
Kathleen McKeownProfessor of Computer Science and Director, Data Science Institute, Columbia UniversityVerified email at cs.columbia.edu
Percy LiangAssociate Professor of Computer Science, Stanford UniversityVerified email at cs.stanford.edu
He HeNew York UniversityVerified email at cs.nyu.edu
Mona DiabProfessor & Director of Language Technologies Institute, Carnegie Mellon University, ACL FellowVerified email at andrew.cmu.edu
Jialu LiUNC Chapel HillVerified email at cs.unc.edu
Arzoo KatiyarPenn State UniversityVerified email at psu.edu
Vlad NiculaeUniversity of AmsterdamVerified email at uva.nl
Kai SunFacebook, Cornell UniversityVerified email at fb.com
Xinya DuUTD, CS; UIUC CS; Cornell University, CSVerified email at utdallas.edu
Xilun ChenMeta FAIRVerified email at fb.com
Barbara PlankProfessor, LMU Munich, Visiting Prof ITU CopenhagenVerified email at lmu.de
Viviana PattiFull Professor of Computer Science, Università diTorino, Dipartimento di InformaticaVerified email at di.unito.it
Malvina NissimProfessor of Computational Linguistics and Society, Rijksuniversiteit GroningenVerified email at rug.nl

Esin Durmus

Anthropic

Verified email at anthropic.com - Homepage

Large Language Models Societal Impacts Evaluating AI Models AI Safety


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
On the opportunities and risks of foundation models R Bommasani arXiv preprint arXiv:2108.07258, 2021	8285	2021
Holistic evaluation of language models P Liang, R Bommasani, T Lee, D Tsipras, D Soylu, M Yasunaga, Y Zhang, ... arXiv preprint arXiv:2211.09110, 2022	2231	2022
Benchmarking large language models for news summarization T Zhang, F Ladhak, E Durmus, P Liang, K McKeown, TB Hashimoto Transactions of the Association for Computational Linguistics 12, 39-57, 2024	834	2024
Whose opinions do language models reflect? S Santurkar, E Durmus, F Ladhak, C Lee, P Liang, T Hashimoto International Conference on Machine Learning, 29971-30004, 2023	821	2023
Scaling monosemanticity: Extracting interpretable features from claude 3 sonnet A Templeton Anthropic, 2024	622	2024
Towards understanding sycophancy in language models M Sharma, M Tong, T Korbak, D Duvenaud, A Askell, SR Bowman, ... arXiv preprint arXiv:2310.13548, 2023	604	2023
Easily accessible text-to-image generation amplifies demographic stereotypes at large scale F Bianchi, P Kalluri, E Durmus, F Ladhak, M Cheng, D Nozza, ... Proceedings of the 2023 ACM conference on fairness, accountability, and …, 2023	566	2023
FEQA: A question answering evaluation framework for faithfulness assessment in abstractive summarization E Durmus, H He, M Diab ACL, 2020	534	2020
Towards measuring the representation of subjective global opinions in language models E Durmus, K Nguyen, TI Liao, N Schiefer, A Askell, A Bakhtin, C Chen, ... arXiv preprint arXiv:2306.16388, 2023	340	2023
Marked personas: Using natural language prompts to measure stereotypes in language models M Cheng, E Durmus, D Jurafsky arXiv preprint arXiv:2305.18189, 2023	301	2023
Measuring faithfulness in chain-of-thought reasoning T Lanham, A Chen, A Radhakrishnan, B Steiner, C Denison, ... arXiv preprint arXiv:2307.13702, 2023	284	2023
WikiLingua: A new benchmark dataset for cross-lingual abstractive summarization F Ladhak, E Durmus, C Cardie, K McKeown arXiv preprint arXiv:2010.03093, 2020	284	2020
Many-shot Jailbreaking C Anil, E Durmus, M Sharma, J Benton, S Kundu, J Batson, N Rimsky, ...	266	2024
Studying large language model generalization with influence functions R Grosse, J Bae, C Anil, N Elhage, A Tamkin, A Tajdini, B Steiner, D Li, ... arXiv preprint arXiv:2308.03296, 2023	261	2023
The gem benchmark: Natural language generation, its evaluation and metrics S Gehrmann, T Adewumi, K Aggarwal, PS Ammanamanchi, A Aremu, ... Proceedings of the 1st Workshop on Natural Language Generation, Evaluation …, 2021	214	2021
On the opportunities and risks of foundation models (2021) R Bommasani, DA Hudson, E Adeli, R Altman, S Arora, S von Arx, ... arXiv preprint arXiv:2108.07258 10, 2022	199	2022
Evaluating human-language model interaction M Lee, M Srivastava, A Hardy, J Thickstun, E Durmus, A Paranjape, ... arXiv preprint arXiv:2212.09746, 2022	186	2022
Collective constitutional ai: Aligning a language model with public input D Ganguli, S Huang, L Lovitt, D Siddarth, T Liao, A Askell, Y Bai, ... Anthropic, 2024	143*	2024
Evaluating and mitigating discrimination in language model decisions A Tamkin, A Askell, L Lovitt, E Durmus, N Joseph, S Kravec, K Nguyen, ... arXiv preprint arXiv:2312.03689, 2023	119	2023
Question decomposition improves the faithfulness of model-generated reasoning A Radhakrishnan, K Nguyen, A Chen, C Chen, C Denison, D Hernandez, ... arXiv preprint arXiv:2307.11768, 2023	111*	2023

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors