References

598 distinct citations across the book (1235 total occurrences). Click an entry to open the verified paper (or a Scholar search if not yet verified).

Hume (1748). search Scholar ↗

×1

Causality and Causal Inference
Mill (1843). search Scholar ↗

×1

Causality and Causal Inference
RCTs (1925). search Scholar ↗

×1

Causality and Causal Inference
Bellman (1957). search Scholar ↗

×1

Reinforcement Learning
Rosenblatt (1958). search Scholar ↗

×1

Deep Learning
Vapnik, Chervonenkis (1971). search Scholar ↗

×1

Theoretical Foundations of Learning
Sauer (1972). search Scholar ↗

×1

Theoretical Foundations of Learning
Shelah (1972). search Scholar ↗

×1

Theoretical Foundations of Learning
Goodhart (1975). search Scholar ↗

×1

Alignment
Rosenbaum and Rubin (1983). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
Hinton and Sejnowski (1985). search Scholar ↗

×1

Generative Models
Rumelhart, Hinton, and Williams (1986). search Scholar ↗

×3

Deep Learning·2 ·3
Robinson (1988). search Scholar ↗

×1

Causality and Causal Inference
Blumer et al. (1989). search Scholar ↗

×1

Theoretical Foundations of Learning
Cybenko (1989). search Scholar ↗

×1

Deep Learning
Hornik et al. (1989). search Scholar ↗

×1

Deep Learning
LeCun et al. (1989). search Scholar ↗

×1

Deep Learning
Watkins (1989). search Scholar ↗

×2

Reinforcement Learning·2
BLAST (1990). search Scholar ↗

×1

AI for Science
Spirtes and Glymour (1991). search Scholar ↗

×1

Causality and Causal Inference
Sutton (1991). search Scholar ↗

×2

Reinforcement Learning·2
TD-Gammon (1992). search Scholar ↗

×1

Reinforcement Learning
Tesauro (1992). search Scholar ↗

×1

Reinforcement Learning
Watkins and Dayan (1992). search Scholar ↗

×3

Reinforcement Learning·2 ·3
Williams (1992). search Scholar ↗

×3

Reinforcement Learning·2 ·3
Pearl (1993). search Scholar ↗

×1

Causality and Causal Inference
Gage (1994). search Scholar ↗

×1

Large Language Models
Robins, Rotnitzky, Zhao (1994). search Scholar ↗

×1

Causality and Causal Inference
State-Action-Reward-State-Action, Rummery and Niranjan (1994). search Scholar ↗

×1

Reinforcement Learning
Cortes and Vapnik (1995). search Scholar ↗

×1

Theoretical Foundations of Learning
Pearl (1995). search Scholar ↗

×5

Causality and Causal Inference·2 ·3 ·4 ·5
Spirtes, Meek, Richardson (1995). search Scholar ↗

×1

Causality and Causal Inference
Hochreiter and Schmidhuber (1997). search Scholar ↗

×5

Deep Learning·2 ·3 ·4·Theoretical Foundations of Learning
Shawe-Taylor and Williamson (1997). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Tsitsiklis and Van Roy (1997). search Scholar ↗

×1

Reinforcement Learning
Bartlett et al. (1998). search Scholar ↗

×3

Theoretical Foundations of Learning·2 ·3
LeCun, Bottou, Bengio, Haffner (1998). search Scholar ↗

×1

Deep Learning
Schapire, Freund, Bartlett, Lee (1998). search Scholar ↗

×2

Theoretical Foundations of Learning·2
McAllester (1999). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Rao and Ballard (1999). search Scholar ↗

×2

Self-Supervised Learning·2
Sutton, McAllester, Singh, Mansour (1999). search Scholar ↗

×3

Reinforcement Learning·2 ·3
Tishby, Pereira, Bialek (1999). search Scholar ↗

×2

Self-Supervised Learning·Theoretical Foundations of Learning
Pearl (2000). search Scholar ↗

×1

Causality and Causal Inference
Kakade (2001). search Scholar ↗

×2

Reinforcement Learning·2
Bousquet and Elisseeff (2002). search Scholar ↗

×1

Theoretical Foundations of Learning
Brafman and Tennenholtz (2002). search Scholar ↗

×1

Reinforcement Learning
Chickering (2002). search Scholar ↗

×1

Causality and Causal Inference
GES, Chickering (2002). search Scholar ↗

×1

Causality and Causal Inference
Kearns and Singh (2002). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Koltchinskii and Panchenko (2002). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Tian and Pearl (2002). search Scholar ↗

×2

Causality and Causal Inference·2
Bengio et al. (2003). search Scholar ↗

×1

Large Language Models
Dwork et al. (2006). search Scholar ↗

×1

Theoretical Foundations of Learning
Hinton and Salakhutdinov (2006). search Scholar ↗

×4

Self-Supervised Learning·2 ·3·Generative Models
Shimizu, Hoyer, Hyvärinen, Kerminen (2006). search Scholar ↗

×1

Causality and Causal Inference
Shpitser and Pearl (2006). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
Strehl-Littman (2008). search Scholar ↗

×1

Theoretical Foundations of Learning
Villani (2008). search Scholar ↗

×1

Generative Models
Vincent et al. (2008). search Scholar ↗

×4

Self-Supervised Learning·2 ·3 ·4
Hoyer et al. (2009). search Scholar ↗

×1

Causality and Causal Inference
Pearl (2009). search Scholar ↗

×1

Causality and Causal Inference
Schmidt and Lipson (2009). search Scholar ↗

×1

AI for Science
Glorot and Bengio (2010). search Scholar ↗

×1

Deep Learning
Jaksch, Ortner, Auer (2010). search Scholar ↗

×1

Theoretical Foundations of Learning
Mikolov et al. (2010). search Scholar ↗

×1

Large Language Models
Glorot et al. (2011). search Scholar ↗

×1

Deep Learning
AlexNet (2012). search Scholar ↗

×2

Self-Supervised Learning·AI for Science
Challenge (2012). search Scholar ↗

×1

AI for Science
ImageNet (2012). search Scholar ↗

×2

Evaluation·2
Krizhevsky, Sutskever, Hinton (2012). search Scholar ↗

×4

Deep Learning·2·Foundation Models·Evaluation
Schölkopf, Janzing, Peters, Sgouritsa, Zhang, Mooij (2012). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
Schuster & Nakajima (2012). search Scholar ↗

×1

Large Language Models
Kingma and Welling (2013). search Scholar ↗

×3

Generative Models·2 ·3
Mikolov et al. (2013). search Scholar ↗

×2

Self-Supervised Learning·Foundation Models
Mnih et al. (2013). search Scholar ↗

×2

Reinforcement Learning·2
Russo and Van Roy (2013). search Scholar ↗

×1

Theoretical Foundations of Learning
Bahdanau et al. (2014). search Scholar ↗

×1

Deep Learning
Bostrom (2014). search Scholar ↗

×4

Alignment·2 ·3 ·4
Cho et al. (2014). search Scholar ↗

×2

Deep Learning·2
Goodfellow et al. (2014). search Scholar ↗

×2

Generative Models·2
Kingma and Ba (2014). search Scholar ↗

×2

Deep Learning·2
Pennington, Socher, Manning (2014). search Scholar ↗

×3

Self-Supervised Learning·2·Foundation Models
Silver et al. (2014). search Scholar ↗

×2

Reinforcement Learning·2
Simonyan and Zisserman (2014). search Scholar ↗

×2

Deep Learning·2
Srivastava et al. (2014). search Scholar ↗

×1

Deep Learning
Sutskever et al. (2014). search Scholar ↗

×1

Deep Learning
Szegedy et al. (2014). search Scholar ↗

×2

Deep Learning·2
Zeiler and Fergus (2014). search Scholar ↗

×1

Mechanistic Interpretability
Alipanahi et al. (2015). search Scholar ↗

×1

AI for Science
Antol et al. (2015). search Scholar ↗

×1

Multimodal Models
Bach et al. (2015). search Scholar ↗

×1

Mechanistic Interpretability
Caruana et al. (2015). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
DQN (2015). search Scholar ↗

×1

Reinforcement Learning
He et al. (2015). search Scholar ↗

×5

Deep Learning·2 ·3 ·4 ·5
Hinton et al. (2015). search Scholar ↗

×1

Large Language Models
Imbens and Rubin (2015). search Scholar ↗

×1

Causality and Causal Inference
Ioffe and Szegedy (2015). search Scholar ↗

×1

Deep Learning
Karpathy and Fei-Fei (2015). search Scholar ↗

×1

Multimodal Models
Kiros et al. (2015). search Scholar ↗

×1

Self-Supervised Learning
Lillicrap et al. (2015). search Scholar ↗

×2

Reinforcement Learning·2
ResNet (2015). search Scholar ↗

×1

Self-Supervised Learning
Rezende and Mohamed (2015). search Scholar ↗

×1

Generative Models
Ronneberger, Fischer, Brox (2015). search Scholar ↗

×1

Generative Models
Russakovsky et al. (2015). search Scholar ↗

×3

Foundation Models·Evaluation·2
Schulman et al. (2015). search Scholar ↗

×1

Reinforcement Learning
Sohl-Dickstein et al. (2015). search Scholar ↗

×2

Generative Models·2
Tishby and Zaslavsky (2015). search Scholar ↗

×2

Self-Supervised Learning·Theoretical Foundations of Learning
VanderWeele (2015). search Scholar ↗

×1

Causality and Causal Inference
Vinyals, Toshev, Bengio, Erhan, Google (2015). search Scholar ↗

×1

Multimodal Models
Amodei, Olah, Steinhardt, Christiano, Schulman, Mané (2016). search Scholar ↗

×2

Alignment·2
Ba et al. (2016). search Scholar ↗

×1

Deep Learning
Bellemare et al. (2016). search Scholar ↗

×1

Reinforcement Learning
Chernozhukov et al. (2016). search Scholar ↗

×1

Causality and Causal Inference
Goodfellow, Bengio, Courville (2016). search Scholar ↗

×1

Deep Learning
Hardt, Price, Srebro (2016). search Scholar ↗

×1

Causality and Causal Inference
He et al. (2016). search Scholar ↗

×1

Evaluation
Hendrycks and Gimpel (2016). search Scholar ↗

×1

Deep Learning
Huang et al. (2016). search Scholar ↗

×1

Deep Learning
ICP, Peters-Bühlmann-Meinshausen (2016). search Scholar ↗

×1

Causality and Causal Inference
Kelley et al. (2016). search Scholar ↗

×1

AI for Science
Kingma et al. (2016). search Scholar ↗

×1

Generative Models
Peters, Bühlmann, Meinshausen (2016). search Scholar ↗

×1

Causality and Causal Inference
Radford, Metz, Chintala (2016). search Scholar ↗

×2

Generative Models·2
Ribeiro et al. (2016). search Scholar ↗

×1

Mechanistic Interpretability
Russo and Zou (2016). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Salimans et al. (2016). search Scholar ↗

×1

Generative Models
Schaul et al. (2016). search Scholar ↗

×1

Reinforcement Learning
Schulman, Moritz, Levine, Jordan, Abbeel (2016). search Scholar ↗

×2

Reinforcement Learning·2
Sennrich, Haddow, Birch (2016). search Scholar ↗

×2

Large Language Models·2
Theis, van den Oord, Bethge (2016). search Scholar ↗

×1

Generative Models
Thomas and Brunskill (2016). search Scholar ↗

×1

Causality and Causal Inference
van den Oord et al. (2016). search Scholar ↗

×4

Generative Models·2 ·3 ·4
van Hasselt, Guez, Silver (2016). search Scholar ↗

×1

Reinforcement Learning
Wang et al. (2016). search Scholar ↗

×1

Reinforcement Learning
AlphaZero (2017). search Scholar ↗

×1

Reinforcement Learning
Arjovsky, Chintala, Bottou (2017). search Scholar ↗

×2

Generative Models·2
Bartlett, Foster, Telgarsky (2017). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Bellemare, Dabney, Munos (2017). search Scholar ↗

×1

Reinforcement Learning
Carleo and Troyer (2017). search Scholar ↗

×1

AI for Science
Chouldechova (2017). search Scholar ↗

×2

Causality and Causal Inference·2
Christiano, Leike, Brown, Martic, Legg, Amodei (2017). search Scholar ↗

×12

Reinforcement Learning·2 ·3 ·4·Foundation Models·2·Large Language Models·2·Alignment·2 ·3 ·4
Dinh, Sohl-Dickstein, Bengio (2017). search Scholar ↗

×1

Generative Models
Dziugaite and Roy (2017). search Scholar ↗

×5

Theoretical Foundations of Learning·2 ·3 ·4 ·5
Elfwing et al. (2017). search Scholar ↗

×1

Deep Learning
Gilmer et al. (2017). search Scholar ↗

×1

AI for Science
Goyal et al. (2017). search Scholar ↗

×2

Deep Learning·2
Gulrajani et al. (2017). search Scholar ↗

×1

Generative Models
Gunasekar et al. (2017). search Scholar ↗

×1

Theoretical Foundations of Learning
Heusel et al. (2017). search Scholar ↗

×1

Generative Models
Higgins et al. (2017). search Scholar ↗

×1

Generative Models
Jiang et al. (2017). search Scholar ↗

×1

Theoretical Foundations of Learning
Johnson et al. (2017). search Scholar ↗

×1

Multimodal Models
Keskar et al. (2017). search Scholar ↗

×2

Deep Learning·Theoretical Foundations of Learning
Kleinberg, Mullainathan, Raghavan (2017). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
Kusner, Loftus, Russell, Silva (2017). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
Loshchilov and Hutter (2017). search Scholar ↗

×2

Deep Learning·2
Lundberg-Lee (2017). search Scholar ↗

×1

Mechanistic Interpretability
McCann et al. (2017). search Scholar ↗

×1

Self-Supervised Learning
Neyshabur, Bhojanapalli, Srebro (2017). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Olah, Mordvintsev, Schubert, Distill (2017). search Scholar ↗

×1

Mechanistic Interpretability
Papamakarios, Pavlakou, Murray (2017). search Scholar ↗

×1

Generative Models
Pathak et al. (2017). search Scholar ↗

×1

Reinforcement Learning
Ramachandran et al. (2017). search Scholar ↗

×1

Deep Learning
Schulman, Wolski, Dhariwal, Radford, Klimov (2017). search Scholar ↗

×5

Reinforcement Learning·2 ·3·Large Language Models·2
Schütt et al. (2017). search Scholar ↗

×1

AI for Science
Shalit, Johansson, Sontag (2017). search Scholar ↗

×1

Causality and Causal Inference
Shazeer et al. (2017). search Scholar ↗

×1

Deep Learning
Silver et al. (2017). search Scholar ↗

×1

Reinforcement Learning
Sundararajan, Taly, Yan (2017). search Scholar ↗

×3

Mechanistic Interpretability·2 ·3
Transformer (2017). search Scholar ↗

×1

Deep Learning
van den Oord, Vinyals, Kavukcuoglu (2017). search Scholar ↗

×1

Generative Models
Vaswani et al. (2017). search Scholar ↗

×7

Deep Learning·2 ·3·Foundation Models·2·Large Language Models·2
Wachter et al. (2017). search Scholar ↗

×2

Causality and Causal Inference·2
Wager and Athey (2017). search Scholar ↗

×1

Causality and Causal Inference
Xu and Raginsky (2017). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Zhang et al. (2017). search Scholar ↗

×3

Theoretical Foundations of Learning·2 ·3
Adebayo et al. (2018). search Scholar ↗

×2

Mechanistic Interpretability·2
Arora et al. (2018). search Scholar ↗

×1

Theoretical Foundations of Learning
Barratt and Sharma (2018). search Scholar ↗

×1

Generative Models
Chernozhukov, Chetverikov, Demirer, Duflo, Hansen, Newey, Robins (2018). search Scholar ↗

×2

Causality and Causal Inference·2
Chizat and Bach (2018). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Christiano, Shlegeris, Amodei (2018). search Scholar ↗

×3

Alignment·2 ·3
Conneau et al. (2018). search Scholar ↗

×2

Mechanistic Interpretability·2
Devlin et al. (2018). search Scholar ↗

×6

Self-Supervised Learning·2 ·3·Foundation Models·Large Language Models·2
Frankle and Carbin (2018). search Scholar ↗

×1

Deep Learning
Garipov et al. (2018). search Scholar ↗

×1

Deep Learning
GLUE (2018). search Scholar ↗

×1

Evaluation
GPT (2018). search Scholar ↗

×1

Large Language Models
Ha and Schmidhuber (2018). search Scholar ↗

×2

Reinforcement Learning·2
Hessel et al. (2018). search Scholar ↗

×2

Reinforcement Learning·2
Howard & Ruder (2018). search Scholar ↗

×1

Foundation Models
Irving, Christiano, Amodei (2018). search Scholar ↗

×3

AI Agents and Tool Use·Alignment·2
Jacot, Gabriel, Hongler (2018). search Scholar ↗

×3

Theoretical Foundations of Learning·2 ·3
Jin et al. (2018). search Scholar ↗

×1

AI for Science
Karras, Aila, Laine, Lehtinen (2018). search Scholar ↗

×2

Generative Models·2
Kingma and Dhariwal (2018). search Scholar ↗

×1

Generative Models
Kudo and Richardson (2018). search Scholar ↗

×4

Large Language Models·2 ·3 ·4
Kurutach et al. (2018). search Scholar ↗

×1

Causality and Causal Inference
Leike, Krueger, Everitt, Martic, Maini, Legg (2018). search Scholar ↗

×2

Alignment·2
Manheim and Garrabrant (2018). search Scholar ↗

×2

Alignment·2
NLP (2018). search Scholar ↗

×1

Multimodal Models
Olah et al. (2018). search Scholar ↗

×1

Mechanistic Interpretability
Oord, Li, Vinyals (2018). search Scholar ↗

×4

Self-Supervised Learning·2 ·3 ·4
OpenAI (2018). search Scholar ↗

×1

Reinforcement Learning
Pearl and Mackenzie (2018). search Scholar ↗

×2

Foundation Models·Causality and Causal Inference
Peters et al. (2018). search Scholar ↗

×2

Self-Supervised Learning·Foundation Models
Radford et al. (2018). search Scholar ↗

×6

Self-Supervised Learning·2·Foundation Models·Large Language Models·2·Generative Models
Roch et al. (2018). search Scholar ↗

×1

AI for Science
Sajjadi et al. (2018). search Scholar ↗

×2

Generative Models·2
Soudry et al. (2018). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Thomas et al. (2018). search Scholar ↗

×2

Generative Models·AI for Science
Wager and Athey (2018). search Scholar ↗

×2

Causality and Causal Inference·2
Wang et al. (2018). search Scholar ↗

×1

Evaluation
Wu et al. (2018). search Scholar ↗

×1

AI for Science
Haarnoja et al. (2018b). search Scholar ↗

×1

Reinforcement Learning
Arjovsky, Bottou, Gulrajani, Lopez-Paz (2019). search Scholar ↗

×3

Causality and Causal Inference·2 ·3
Arora et al. (2019). search Scholar ↗

×1

Theoretical Foundations of Learning
Belkin, Hsu, Ma, Mandal (2019). search Scholar ↗

×3

Theoretical Foundations of Learning·2 ·3
Borji (2019). search Scholar ↗

×1

Generative Models
Brock, Donahue, Simonyan (2019). search Scholar ↗

×2

Generative Models·2
Chollet (2019). search Scholar ↗

×1

Evaluation
Hewitt and Liang (2019). search Scholar ↗

×1

Mechanistic Interpretability
Houlsby et al. (2019). search Scholar ↗

×1

Foundation Models
Hubinger et al. (2019). search Scholar ↗

×1

Alignment
Hudson and Manning (2019). search Scholar ↗

×1

Multimodal Models
Hyvärinen, Sasaki, Turner (2019). search Scholar ↗

×2

Causality and Causal Inference·2
Jain and Wallace (2019). search Scholar ↗

×2

Mechanistic Interpretability·2
Karras, Laine, Aila (2019). search Scholar ↗

×2

Generative Models·2
Künzel et al. (2019). search Scholar ↗

×1

Causality and Causal Inference
Kynkäänniemi et al. (2019). search Scholar ↗

×1

Generative Models
Li et al. (2019). search Scholar ↗

×1

Multimodal Models
Locatello et al. (2019). search Scholar ↗

×3

Generative Models·Causality and Causal Inference·2
Lu et al. (2019). search Scholar ↗

×1

Multimodal Models
Marcus and Davis (2019). search Scholar ↗

×1

Foundation Models
Mei and Montanari (2019). search Scholar ↗

×1

Theoretical Foundations of Learning
Nagarajan and Kolter (2019). search Scholar ↗

×6

Theoretical Foundations of Learning·2 ·3 ·4 ·5 ·6
Negrea et al. (2019). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Peyré and Cuturi (2019). search Scholar ↗

×1

Generative Models
Radford et al. (2019). search Scholar ↗

×5

Self-Supervised Learning·Large Language Models·2 ·3·Generative Models
Raffel et al. (2019). search Scholar ↗

×4

Self-Supervised Learning·2·Foundation Models·Large Language Models
Raissi, Perdikaris, Karniadakis (2019). search Scholar ↗

×1

AI for Science
Saunshi et al. (2019). search Scholar ↗

×1

Self-Supervised Learning
Schreck et al. (2019). search Scholar ↗

×1

AI for Science
Shi, Blei, Veitch (2019). search Scholar ↗

×1

Causality and Causal Inference
Song, Ermon (2019). search Scholar ↗

×2

Generative Models·2
SuperGLUE (2019). search Scholar ↗

×1

Evaluation
Tan and Bansal (2019). search Scholar ↗

×2

Deep Learning·Multimodal Models
Zhang and Sennrich (2019). search Scholar ↗

×5

Deep Learning·2 ·3·Large Language Models·2
Abnar and Zuidema (2020). search Scholar ↗

×2

Mechanistic Interpretability·2
Bartlett, Long, Lugosi, Tsigler (2020). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Belkin, Hsu, Xu (2020). search Scholar ↗

×1

Theoretical Foundations of Learning
Beltagy, Peters, Cohan (2020). search Scholar ↗

×1

Deep Learning
Brown et al. (2020). search Scholar ↗

×6

Foundation Models·2·Large Language Models·2 ·3 ·4
Bu, Zou, Veeravalli (2020). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Burger et al. (2020). search Scholar ↗

×1

AI for Science
Caron et al. (2020). search Scholar ↗

×3

Self-Supervised Learning·2 ·3
Chen et al. (2020). search Scholar ↗

×4

Self-Supervised Learning·2 ·3·Multimodal Models
Chithrananda et al. (2020). search Scholar ↗

×1

AI for Science
Cranmer et al. (2020). search Scholar ↗

×1

AI for Science
Dosovitskiy et al. (2020). search Scholar ↗

×4

Deep Learning·2 ·3·Foundation Models
Dunn et al. (2020). search Scholar ↗

×1

AI for Science
Fu et al. (2020). search Scholar ↗

×1

Reinforcement Learning
Gao et al. (2020). search Scholar ↗

×2

Foundation Models·Large Language Models
Gehman et al. (2020). search Scholar ↗

×2

Alignment·Evaluation
Grill et al. (2020). search Scholar ↗

×3

Self-Supervised Learning·2 ·3
Gu et al. (2020). search Scholar ↗

×2

Deep Learning·2
Hafner, Lillicrap, Norouzi, Ba (2020). search Scholar ↗

×2

Reinforcement Learning·2
He et al. (2020). search Scholar ↗

×3

Self-Supervised Learning·2 ·3
Hermann et al. (2020). search Scholar ↗

×1

AI for Science
Hernán and Robins (2020). search Scholar ↗

×2

Causality and Causal Inference·2
Ho, Jain, Abbeel (2020). search Scholar ↗

×1

Generative Models
Holtzman et al. (2020). search Scholar ↗

×1

Large Language Models
Jin et al. (2020). search Scholar ↗

×1

Theoretical Foundations of Learning
June (2020). search Scholar ↗

×1

Evaluation
Kaplan et al. (2020). search Scholar ↗

×10

Deep Learning·Theoretical Foundations of Learning·2 ·3·Foundation Models·2 ·3 ·4·Large Language Models·2
Khemakhem et al. (2020). search Scholar ↗

×1

Causality and Causal Inference
Krakovna et al. (2020). search Scholar ↗

×1

Alignment
Kumar, Zhou, Tucker, Levine (2020). search Scholar ↗

×2

Reinforcement Learning·2
Meta (2020). search Scholar ↗

×1

AI for Science
Mildenhall et al. (2020). search Scholar ↗

×1

Generative Models
MuZero (2020). search Scholar ↗

×1

Reinforcement Learning
Nair, Gupta, Dalal, Levine (2020). search Scholar ↗

×1

Reinforcement Learning
Nakkiran et al. (2020). search Scholar ↗

×2

Theoretical Foundations of Learning·2
November (2020). search Scholar ↗

×1

AI for Science
Olah, Cammarata, Schubert, Goh, Petrov, Carter, Distill (2020). search Scholar ↗

×1

Mechanistic Interpretability
Pfau et al. (2020). search Scholar ↗

×1

AI for Science
Raffel et al. (2020). search Scholar ↗

×1

Generative Models
Rasp et al. (2020). search Scholar ↗

×1

AI for Science
Schrittwieser et al. (2020). search Scholar ↗

×2

Reinforcement Learning·2
Senior et al. (2020). search Scholar ↗

×2

Generative Models·AI for Science
Shazeer (2020). search Scholar ↗

×5

Deep Learning·2 ·3·Large Language Models·2
Song, Ermon (2020). search Scholar ↗

×2

Generative Models·2
Steinke and Zakynthinou (2020). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Stiennon et al. (2020). search Scholar ↗

×4

Reinforcement Learning·2 ·3·Alignment
Tschannen et al. (2020). search Scholar ↗

×5

Self-Supervised Learning·2 ·3 ·4 ·5
Udrescu and Tegmark (2020). search Scholar ↗

×1

AI for Science
Vig et al. (2020). search Scholar ↗

×1

Mechanistic Interpretability
Xiong et al. (2020). search Scholar ↗

×1

Deep Learning
Yang and Wang (2020). search Scholar ↗

×1

Theoretical Foundations of Learning
Akbari et al. (2021). search Scholar ↗

×1

Self-Supervised Learning
Anthropic (2021). search Scholar ↗

×1

Mechanistic Interpretability
Austin et al. (2021). search Scholar ↗

×1

Evaluation
Avsec et al. (2021). search Scholar ↗

×1

AI for Science
Bender et al. (2021). search Scholar ↗

×5

Foundation Models·2·Large Language Models·2 ·3
Bommasani et al. (2021). search Scholar ↗

×5

Self-Supervised Learning·Foundation Models·2 ·3·Large Language Models
Cao (2021). search Scholar ↗

×1

AI for Science
Caron et al. (2021). search Scholar ↗

×4

Self-Supervised Learning·2 ·3·Foundation Models
Chanussot et al. (2021). search Scholar ↗

×1

AI for Science
Chen et al. (2021). search Scholar ↗

×1

Evaluation
CLIP (2021). search Scholar ↗

×1

Multimodal Models
Cobbe et al. (2021). search Scholar ↗

×2

Evaluation·2
Cohen et al. (2021). search Scholar ↗

×1

Theoretical Foundations of Learning
Cotra (2021). search Scholar ↗

×2

Alignment·2
Davies et al. (2021). search Scholar ↗

×2

AI for Science·2
Dhariwal and Nichol (2021). search Scholar ↗

×1

Generative Models
Du et al. (2021). search Scholar ↗

×1

Theoretical Foundations of Learning
Elhage et al. (2021). search Scholar ↗

×4

Deep Learning·2·Mechanistic Interpretability·2
Esser, Rombach, Ommer (2021). search Scholar ↗

×2

Generative Models·2
Geiger et al. (2021). search Scholar ↗

×1

Mechanistic Interpretability
Geva et al. (2021). search Scholar ↗

×1

Mechanistic Interpretability
Goh et al. (2021). search Scholar ↗

×3

Mechanistic Interpretability·2 ·3
Google (2021). search Scholar ↗

×1

Multimodal Models
Gu, Goel, and Ré (2021). search Scholar ↗

×2

Deep Learning·2
HaoChen et al. (2021). search Scholar ↗

×2

Self-Supervised Learning·2
Hendrycks et al. (2021). search Scholar ↗

×5

Evaluation·2 ·3 ·4 ·5
Hernandez et al. (2021). search Scholar ↗

×1

Theoretical Foundations of Learning
Ho, Salimans (2021). search Scholar ↗

×2

Generative Models·2
Hu et al. (2021). search Scholar ↗

×2

Foundation Models·2
HumanEval (2021). search Scholar ↗

×1

Evaluation
Jia et al. (2021). search Scholar ↗

×2

Self-Supervised Learning·2
Jin, Liu, Yang (2021). search Scholar ↗

×3

Theoretical Foundations of Learning·2 ·3
Jumper et al. (2021). search Scholar ↗

×8

Foundation Models·2 ·3 ·4 ·5·Generative Models·AI for Science·2
Karimi et al. (2021). search Scholar ↗

×2

Causality and Causal Inference·2
Khalifa et al. (2021). search Scholar ↗

×1

Alignment
Lester et al. (2021). search Scholar ↗

×1

Foundation Models
Li and Liang (2021). search Scholar ↗

×2

Foundation Models·AI for Science
Lu et al. (2021). search Scholar ↗

×1

AI for Science
MMLU (2021). search Scholar ↗

×1

Evaluation
Nakano et al. (2021). search Scholar ↗

×1

AI Agents and Tool Use
Nichol et al. (2021). search Scholar ↗

×1

Generative Models
OpenAI (2021). search Scholar ↗

×1

AI Agents and Tool Use
Pérez-Ortiz et al. (2021). search Scholar ↗

×1

Theoretical Foundations of Learning
Press, Smith, Lewis (2021). search Scholar ↗

×3

Deep Learning·Large Language Models·2
Radford et al. (2021). search Scholar ↗

×10

Deep Learning·Self-Supervised Learning·2 ·3 ·4·Foundation Models·2 ·3·Generative Models·Multimodal Models
Ramesh et al. (2021). search Scholar ↗

×1

Generative Models
Rosenfeld, Ravikumar, Risteski (2021). search Scholar ↗

×2

Causality and Causal Inference·2
Schölkopf, Locatello, Bauer, Ke, Kalchbrenner, Goyal, Bengio (2021). search Scholar ↗

×2

Causality and Causal Inference·2
Song, Meng, Ermon (2021). search Scholar ↗

×4

Generative Models·2 ·3 ·4
Su et al. (2021). search Scholar ↗

×5

Deep Learning·2 ·3·Large Language Models·2
Tian et al. (2021). search Scholar ↗

×1

Self-Supervised Learning
Wang et al. (2021). search Scholar ↗

×1

Evaluation
Wei et al. (2021). search Scholar ↗

×1

Large Language Models
Yang and Hu (2021). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Zimmermann et al. (2021). search Scholar ↗

×1

Causality and Causal Inference
Akyürek et al. (2022). search Scholar ↗

×1

Large Language Models
Alayrac et al. (2022). search Scholar ↗

×2

Self-Supervised Learning·2
Anthropic (2022). search Scholar ↗

×12

Mechanistic Interpretability·2 ·3 ·4 ·5·Alignment·2 ·3 ·4 ·5·Evaluation·2
April (2022). search Scholar ↗

×1

Evaluation
Bai et al. (2022). search Scholar ↗

×5

Foundation Models·Large Language Models·2·Alignment·2
Batatia et al. (2022). search Scholar ↗

×2

AI for Science·2
Batzner et al. (2022). search Scholar ↗

×2

AI for Science·2
Betker (2022). search Scholar ↗

×1

Multimodal Models
Burns et al. (2022). search Scholar ↗

×6

Mechanistic Interpretability·2 ·3 ·4·Alignment·2
Chen and Ong (2022). search Scholar ↗

×3

Large Language Models·AI for Science·2
Clark et al. (2022). search Scholar ↗

×1

Large Language Models
Dai et al. (2022). search Scholar ↗

×1

Mechanistic Interpretability
Dao et al. (2022). search Scholar ↗

×2

Deep Learning·2
Dauparas et al. (2022). search Scholar ↗

×1

AI for Science
Elhage et al. (2022). search Scholar ↗

×2

Mechanistic Interpretability·2
Fedus et al. (2022). search Scholar ↗

×2

Deep Learning·2
Flamingo (2022). search Scholar ↗

×1

Multimodal Models
Frohberg and Binder (2022). search Scholar ↗

×1

Causality and Causal Inference
Ganguli (2022). search Scholar ↗

×1

Evaluation
Garg et al. (2022). search Scholar ↗

×1

Large Language Models
Geiger and Smidt (2022). search Scholar ↗

×2

Generative Models·AI for Science
Hartvigsen et al. (2022). search Scholar ↗

×2

Alignment·Evaluation
He et al. (2022). search Scholar ↗

×3

Self-Supervised Learning·2 ·3
HELM (2022). search Scholar ↗

×1

Evaluation
Hoffmann et al. (2022). search Scholar ↗

×11

Deep Learning·Theoretical Foundations of Learning·2 ·3·Foundation Models·2 ·3 ·4 ·5·Large Language Models·2
Hoogeboom et al. (2022). search Scholar ↗

×1

AI for Science
Ilharco et al. (2022). search Scholar ↗

×1

Multimodal Models
Irwin et al. (2022). search Scholar ↗

×1

AI for Science
Kojima et al. (2022). search Scholar ↗

×2

Large Language Models·2
Kostrikov, Nair, Levine (2022). search Scholar ↗

×2

Reinforcement Learning·2
LAION (2022). search Scholar ↗

×1

Multimodal Models
LeCun (2022). search Scholar ↗

×2

Self-Supervised Learning·2
Lee et al. (2022). search Scholar ↗

×4

Self-Supervised Learning·Foundation Models·2·Large Language Models
Li, Li, Xiong, Hoi, Salesforce (2022). search Scholar ↗

×3

Self-Supervised Learning·2·Multimodal Models
Liang et al. (2022). search Scholar ↗

×3

Foundation Models·Evaluation·2
Lin, Hilton, Evans (2022). search Scholar ↗

×4

Alignment·Evaluation·AI for Science·2
Lipman, Chen, Ben-Hamu, Nickel, Le (2022). search Scholar ↗

×2

Generative Models·2
Lippe et al. (2022). search Scholar ↗

×1

Causality and Causal Inference
Liu, Gong, Liu (2022). search Scholar ↗

×6

Deep Learning·2·Foundation Models·Generative Models·2 ·3
Lotfi et al. (2022). search Scholar ↗

×2

Theoretical Foundations of Learning·2
Lu et al. (2022). search Scholar ↗

×3

Large Language Models·2·Generative Models
Magar and Schwartz (2022). search Scholar ↗

×1

Evaluation
Meng, Bau, Andonian, Belinkov (2022). search Scholar ↗

×4

Mechanistic Interpretability·2 ·3 ·4
Min et al. (2022). search Scholar ↗

×2

Large Language Models·2
Nov (2022). search Scholar ↗

×1

Alignment
November (2022). search Scholar ↗

×1

Alignment
October (2022). search Scholar ↗

×1

AI Agents and Tool Use
Olsson et al. (2022). search Scholar ↗

×6

Deep Learning·Self-Supervised Learning·Large Language Models·2·Mechanistic Interpretability·2
OpenAI (2022). search Scholar ↗

×1

Multimodal Models
Ouyang et al. (2022). search Scholar ↗

×8

Reinforcement Learning·2·Foundation Models·Large Language Models·2 ·3 ·4·Alignment
Pan, Bhatia, Steinhardt (2022). search Scholar ↗

×1

Alignment
Pathak et al. (2022). search Scholar ↗

×2

AI for Science·2
Perez et al. (2022). search Scholar ↗

×5

Alignment·2·Evaluation·2 ·3
Poole et al. (2022). search Scholar ↗

×1

Generative Models
Radford-Kim et al. (2022). search Scholar ↗

×4

Self-Supervised Learning·2·Foundation Models·Multimodal Models
Ramesh et al. (2022). search Scholar ↗

×1

Generative Models
ReAct (2022). search Scholar ↗

×1

AI Agents and Tool Use
Reed et al. (2022). search Scholar ↗

×2

Foundation Models·2
Rombach, Blattmann, Lorenz, Esser, Ommer (2022). search Scholar ↗

×3

Generative Models·2 ·3
Ross et al. (2022). search Scholar ↗

×1

AI for Science
Saharia et al. (2022). search Scholar ↗

×1

Generative Models
Saunshi et al. (2022). search Scholar ↗

×2

Self-Supervised Learning·2
Srivastava et al. (2022). search Scholar ↗

×2

Evaluation·2
Subramani et al. (2022). search Scholar ↗

×3

Mechanistic Interpretability·2 ·3
Suzgun et al. (2022). search Scholar ↗

×1

Evaluation
Wang, Variengien, Conmy, Shlegeris, Steinhardt (2022). search Scholar ↗

×10

Large Language Models·2·Mechanistic Interpretability·2 ·3 ·4 ·5 ·6 ·7 ·8
Wei et al. (2022). search Scholar ↗

×8

Theoretical Foundations of Learning·2·Foundation Models·2 ·3·Large Language Models·2 ·3
Xie et al. (2022). search Scholar ↗

×1

Large Language Models
Xue et al. (2022). search Scholar ↗

×1

Large Language Models
Yao, Zhao, Yu, Du, Shafran, Narasimhan, Cao (2022). search Scholar ↗

×4

AI Agents and Tool Use·2 ·3 ·4
Yu et al. (2022). search Scholar ↗

×1

Large Language Models
Zheng, Han, Polu (2022). search Scholar ↗

×1

AI for Science
Zhou et al. (2022). search Scholar ↗

×1

Deep Learning
Ainslie et al. (2023). search Scholar ↗

×4

Deep Learning·2·Large Language Models·2
Anthropic, October (2023). search Scholar ↗

×3

Mechanistic Interpretability·2 ·3
Arena (2023). search Scholar ↗

×1

Evaluation
Assran et al. (2023). search Scholar ↗

×2

Self-Supervised Learning·2
Azar et al. (2023). search Scholar ↗

×1

Large Language Models
Bai et al. (2023). search Scholar ↗

×1

Multimodal Models
Berkeley (2023). search Scholar ↗

×1

AI for Science
Bi et al. (2023). search Scholar ↗

×2

AI for Science·2
Biderman et al. (2023). search Scholar ↗

×1

Large Language Models
Bills et al. (2023). search Scholar ↗

×1

Mechanistic Interpretability
Boiko et al. (2023). search Scholar ↗

×2

AI for Science·2
Bran et al. (2023). search Scholar ↗

×2

AI for Science·2
Bricken et al. (2023). search Scholar ↗

×1

Mechanistic Interpretability
Brooks, Holynski, Efros (2023). search Scholar ↗

×1

Generative Models
Burns (2023). search Scholar ↗

×1

Alignment
Carlini et al. (2023). search Scholar ↗

×4

Theoretical Foundations of Learning·Generative Models·2 ·3
Casper et al. (2023). search Scholar ↗

×1

Alignment
Chen et al. (2023). search Scholar ↗

×2

Deep Learning·Large Language Models
Cheng et al. (2023). search Scholar ↗

×2

AI for Science·2
Coqui (2023). search Scholar ↗

×1

Multimodal Models
Cranmer (2023). search Scholar ↗

×1

AI for Science
Cui et al. (2023). search Scholar ↗

×1

AI for Science
Cunningham, Ewart, Riggs, Huben, Sharkey (2023). search Scholar ↗

×2

Mechanistic Interpretability·2
Dao (2023). search Scholar ↗

×2

Deep Learning·2
December (2023). search Scholar ↗

×2

Multimodal Models·Alignment
DeepMind, December (2023). search Scholar ↗

×1

Multimodal Models
Du et al. (2023). search Scholar ↗

×2

AI Agents and Tool Use·2
Frei et al. (2023). search Scholar ↗

×1

Theoretical Foundations of Learning
Gao, Schulman, Hilton (2023). search Scholar ↗

×2

Alignment·2
Goldowsky-Dill et al. (2023). search Scholar ↗

×1

Mechanistic Interpretability
Goldstein et al. (2023). search Scholar ↗

×2

Alignment·Evaluation
Google (2023). search Scholar ↗

×2

Generative Models·Multimodal Models
Gould et al. (2023). search Scholar ↗

×1

Mechanistic Interpretability
Gu and Dao (2023). search Scholar ↗

×4

Deep Learning·2·Foundation Models·Large Language Models
Hafner et al. (2023). search Scholar ↗

×1

Reinforcement Learning
Hendel, Geva, Globerson (2023). search Scholar ↗

×2

Large Language Models·Mechanistic Interpretability
Hilton et al. (2023). search Scholar ↗

×1

Theoretical Foundations of Learning
Ingraham et al. (2023). search Scholar ↗

×2

Generative Models·AI for Science
Jin et al. (2023). search Scholar ↗

×1

Causality and Causal Inference
July (2023). search Scholar ↗

×1

Alignment
Kerbl et al. (2023). search Scholar ↗

×1

Generative Models
Kiela (2023). search Scholar ↗

×1

Evaluation
Kirillov et al. (2023). search Scholar ↗

×3

Foundation Models·2 ·3
Kwon et al. (2023). search Scholar ↗

×4

Deep Learning·2·Large Language Models·2
Lam et al. (2023). search Scholar ↗

×2

AI for Science·2
Leviathan, Kalman, Matias (2023). search Scholar ↗

×3

Large Language Models·2 ·3
Li et al. (2023). search Scholar ↗

×2

Multimodal Models·2
Liao et al. (2023). search Scholar ↗

×1

AI for Science
Lightman et al. (2023). search Scholar ↗

×3

Reinforcement Learning·2·Alignment
Liu, Li, Wu, Lee (2023). search Scholar ↗

×5

Deep Learning·2·Multimodal Models·2·Evaluation
Madaan et al. (2023). search Scholar ↗

×1

Alignment
Mamba, Gu and Dao (2023). search Scholar ↗

×1

Deep Learning
March (2023). search Scholar ↗

×2

Alignment·Evaluation
Marks and Tegmark (2023). search Scholar ↗

×1

Alignment
Meng et al. (2023). search Scholar ↗

×2

Mechanistic Interpretability·2
Merchant et al. (2023). search Scholar ↗

×4

AI for Science·2 ·3 ·4
Meta (2023). search Scholar ↗

×4

Generative Models·Multimodal Models·2 ·3
METR (2023). search Scholar ↗

×4

AI Agents and Tool Use·Alignment·2·Evaluation
Mialon et al. (2023). search Scholar ↗

×2

AI Agents and Tool Use·Evaluation
Michael-Mahdi-Rein et al. (2023). search Scholar ↗

×1

Alignment
Microsoft, August (2023). search Scholar ↗

×4

Multimodal Models·AI Agents and Tool Use·2 ·3
Musaelian et al. (2023). search Scholar ↗

×1

AI for Science
Nov (2023). search Scholar ↗

×1

Evaluation
November (2023). search Scholar ↗

×3

Alignment·2·Evaluation
Oct (2023). search Scholar ↗

×1

Evaluation
October (2023). search Scholar ↗

×2

Alignment·2
OpenAI, September (2023). search Scholar ↗

×5

Foundation Models·Large Language Models·Multimodal Models·2·Alignment
Padmakumar and He (2023). search Scholar ↗

×1

Alignment
Park, Lan, Tran, Park (2023). search Scholar ↗

×2

Alignment·2
Peebles and Xie (2023). search Scholar ↗

×2

Generative Models·2
Peng et al. (2023). search Scholar ↗

×5

Deep Learning·2 ·3·Large Language Models·2
Rafailov, Sharma, Mitchell, Manning, Ermon, Finn (2023). search Scholar ↗

×6

Reinforcement Learning·Foundation Models·2·Large Language Models·2·Alignment
Rein et al. (2023). search Scholar ↗

×2

Alignment·Evaluation
Romera-Paredes et al. (2023). search Scholar ↗

×3

AI for Science·2 ·3
Roohani et al. (2023). search Scholar ↗

×1

AI for Science
Rosen et al. (2023). search Scholar ↗

×1

AI for Science
Sainz et al. (2023). search Scholar ↗

×3

Evaluation·2 ·3
Schaeffer et al. (2023). search Scholar ↗

×9

Theoretical Foundations of Learning·2 ·3·Foundation Models·2 ·3 ·4·Alignment·Evaluation
Schick, Dwivedi-Yu, Dessì, Raileanu, Lomeli, Hambro, Zettlemoyer, Cancedda, Scialom (2023). search Scholar ↗

×3

AI Agents and Tool Use·2 ·3
September (2023). search Scholar ↗

×1

Multimodal Models
Sharma et al. (2023). search Scholar ↗

×9

Mechanistic Interpretability·Alignment·2 ·3 ·4 ·5 ·6 ·7·Evaluation
Shinn et al. (2023). search Scholar ↗

×1

AI Agents and Tool Use
Sun et al. (2023). search Scholar ↗

×1

Multimodal Models
Syed et al. (2023). search Scholar ↗

×1

Mechanistic Interpretability
Theodoris et al. (2023). search Scholar ↗

×1

AI for Science
Tran et al. (2023). search Scholar ↗

×1

AI for Science
Tsigler and Bartlett (2023). search Scholar ↗

×1

Theoretical Foundations of Learning
Turner et al. (2023). search Scholar ↗

×3

Mechanistic Interpretability·2 ·3
von Oswald et al. (2023). search Scholar ↗

×1

Large Language Models
Wang et al. (2023). search Scholar ↗

×3

Generative Models·Evaluation·AI for Science
Watson et al. (2023). search Scholar ↗

×4

Generative Models·AI for Science·2 ·3
Wei, Haghtalab, Steinhardt (2023). search Scholar ↗

×5

Alignment·2 ·3 ·4 ·5
Willard & Louf (2023). search Scholar ↗

×1

Large Language Models
Wu et al. (2023). search Scholar ↗

×1

Generative Models
Yao et al. (2023). search Scholar ↗

×3

Large Language Models·AI Agents and Tool Use·2
Yu et al. (2023). search Scholar ↗

×2

Large Language Models·Multimodal Models
Zhai et al. (2023). search Scholar ↗

×2

Self-Supervised Learning·2
Zhang, Rao, Agrawala (2023). search Scholar ↗

×4

Generative Models·2·Multimodal Models·Causality and Causal Inference
Zheng-Chiang et al. (2023). search Scholar ↗

×5

Evaluation·2 ·3 ·4 ·5
Zhong et al. (2023). search Scholar ↗

×1

Evaluation
Zhou et al. (2023). search Scholar ↗

×4

Large Language Models·AI Agents and Tool Use·2 ·3
Zhu et al. (2023). search Scholar ↗

×1

Multimodal Models
Zou, Phan, Chen, Campbell, Guo, Ren, Pan, Yin, Mazeika, Dombrowski, Goel, Li, Byun, Wang, Mallen, Basart, Koyejo, Song, Fredrikson, Kolter, Hendrycks (2023). search Scholar ↗

×7

Mechanistic Interpretability·2·Alignment·2 ·3 ·4·Evaluation
Abramson et al. (2024). search Scholar ↗

×3

Generative Models·AI for Science·2
AIME (2024). search Scholar ↗

×1

Evaluation
Anthropic, March (2024). search Scholar ↗

×9

Multimodal Models·Mechanistic Interpretability·2 ·3 ·4·Alignment·2 ·3 ·4
Apple (2024). search Scholar ↗

×2

Evaluation·2
Arditi, Obeso, Syed, Paleka, Panickssery, Gurnee, Nanda (2024). search Scholar ↗

×8

Mechanistic Interpretability·2 ·3 ·4 ·5·Alignment·2 ·3
Bardes et al. (2024). search Scholar ↗

×1

Self-Supervised Learning
Batatia et al. (2024). search Scholar ↗

×1

AI for Science
Bussmann et al. (2024). search Scholar ↗

×1

Mechanistic Interpretability
Cai et al. (2024). search Scholar ↗

×1

Large Language Models
Chen et al. (2024). search Scholar ↗

×1

Multimodal Models
Clymer et al. (2024). search Scholar ↗

×1

Alignment
Dalla-Torre et al. (2024). search Scholar ↗

×1

AI for Science
Dao and Gu (2024). search Scholar ↗

×2

Deep Learning·2
DeepMind, July (2024). search Scholar ↗

×13

Generative Models·AI Agents and Tool Use·2·Mechanistic Interpretability·2 ·3·AI for Science·2 ·3 ·4 ·5 ·6 ·7
Ethayarajh et al. (2024). search Scholar ↗

×1

Large Language Models
Fu et al. (2024). search Scholar ↗

×1

Large Language Models
Geiger et al. (2024). search Scholar ↗

×1

Mechanistic Interpretability
Glazer et al. (2024). search Scholar ↗

×1

Evaluation
Google (2024). search Scholar ↗

×1

Multimodal Models
Greenblatt, Shlegeris, Sachan, Roger (2024). search Scholar ↗

×8

AI Agents and Tool Use·2 ·3·Alignment·2 ·3 ·4 ·5
Groeneveld et al. (2024). search Scholar ↗

×1

Large Language Models
Hao et al. (2024). search Scholar ↗

×1

AI for Science
Hendrycks et al. (2024). search Scholar ↗

×1

Alignment
Hong et al. (2024). search Scholar ↗

×3

Large Language Models·AI Agents and Tool Use·2
Hsieh et al. (2024). search Scholar ↗

×2

Large Language Models·2
Hubinger et al. (2024). search Scholar ↗

×11

AI Agents and Tool Use·Mechanistic Interpretability·2 ·3·Alignment·2 ·3 ·4 ·5 ·6 ·7
Jain et al. (2024). search Scholar ↗

×2

Evaluation·2
Jimenez, Yang, Wettig, Yao, Pei, Press, Narasimhan (2024). search Scholar ↗

×3

AI Agents and Tool Use·Evaluation·2
Khan et al. (2024). search Scholar ↗

×1

Alignment
Kim et al. (2024). search Scholar ↗

×1

Evaluation
Korbak et al. (2024). search Scholar ↗

×1

Alignment
Lu et al. (2024). search Scholar ↗

×1

Multimodal Models
March (2024). search Scholar ↗

×2

Multimodal Models·Evaluation
May (2024). search Scholar ↗

×6

Multimodal Models·Mechanistic Interpretability·Alignment·2·Evaluation·2
Meta (2024). search Scholar ↗

×1

Generative Models
METR (2024). search Scholar ↗

×1

Evaluation
Microsoft (2024). search Scholar ↗

×5

AI for Science·2 ·3 ·4 ·5
Mirzadeh et al. (2024). search Scholar ↗

×1

Evaluation
Mouton et al. (2024). search Scholar ↗

×1

Evaluation
October (2024). search Scholar ↗

×5

Multimodal Models·2·AI Agents and Tool Use·2 ·3
OpenAI, June (2024). search Scholar ↗

×7

Reinforcement Learning·Generative Models·Multimodal Models·2 ·3·Mechanistic Interpretability·2
Panickssery, Bowman, Feng (2024). search Scholar ↗

×1

Evaluation
Park et al. (2024). search Scholar ↗

×2

Mechanistic Interpretability·2
Price et al. (2024). search Scholar ↗

×1

AI for Science
RAND (2024). search Scholar ↗

×4

Alignment·2·Evaluation·2
Rasp et al. (2024). search Scholar ↗

×1

AI for Science
Replit (2024). search Scholar ↗

×1

AI Agents and Tool Use
Sakana (2024). search Scholar ↗

×2

AI for Science·2
Salvi et al. (2024). search Scholar ↗

×3

Alignment·Evaluation·2
September (2024). search Scholar ↗

×1

AI Agents and Tool Use
Shah et al. (2024). search Scholar ↗

×1

Deep Learning
Shumailov et al. (2024). search Scholar ↗

×4

Self-Supervised Learning·2·Foundation Models·2
Suno and Udio (2024). search Scholar ↗

×1

Multimodal Models
Templeton et al. (2024). search Scholar ↗

×1

Mechanistic Interpretability
Trinh et al. (2024). search Scholar ↗

×2

AI for Science·2
Wang et al. (2024). search Scholar ↗

×1

Evaluation
Xie et al. (2024). search Scholar ↗

×2

AI Agents and Tool Use·Evaluation
Xu et al. (2024). search Scholar ↗

×2

AI Agents and Tool Use·Evaluation
Yue et al. (2024). search Scholar ↗

×1

Multimodal Models
AI (2025). search Scholar ↗

×2

Reinforcement Learning·2
AIME (2025). search Scholar ↗

×1

Evaluation
Feb (2025). search Scholar ↗

×1

Evaluation
February (2025). search Scholar ↗

×2

AI Agents and Tool Use·Alignment
Jan (2025). search Scholar ↗

×1

AI Agents and Tool Use
January (2025). search Scholar ↗

×5

Multimodal Models·AI Agents and Tool Use·2 ·3 ·4
METR (2025). search Scholar ↗

×3

AI Agents and Tool Use·Evaluation·2
NVIDIA (2025). search Scholar ↗

×1

Multimodal Models
US (2025). search Scholar ↗

×1

Alignment