Code Soliloquies for Accurate Calculations in Large Language Models-Reference-Cited by-同舟云学术

Code Soliloquies for Accurate Calculations in Large Language Models

Published:2024-03-18 Issue: Volume: Page:
ISSN:
Container-title:Proceedings of the 14th Learning Analytics and Knowledge Conference
language:
Short-container-title:

Author:

Sonkar Shashank¹^ORCID,Chen Xinghe²^ORCID,Le Myco²^ORCID,Liu Naiming¹^ORCID,Basu Mallick Debshila³^ORCID,Baraniuk Richard¹^ORCID

Affiliation:

1. Electrical and Computer Engineering, Rice University, USA

2. Rice University, USA

3. OpenStax, Rice University, USA

Funder

Office of Naval Research

Vannevar Bush Faculty Fellowship

Air Force Office of Scientific Research

NSF (National Science Foundation)

Publisher

ACM

Link

https://dl.acm.org/doi/pdf/10.1145/3636555.3636889

Reference32 articles.

1. Sébastien Bubeck, Varun Chandrasekaran, Ronen Eldan, Johannes Gehrke, Eric Horvitz, Ece Kamar, Peter Lee, Yin Tat Lee, Yuanzhi Li, Scott Lundberg, 2023. Sparks of Artificial General Intelligence: Early experiments with GPT-4. arXiv preprint arXiv:2303.12712 (2023).

2. Wenhu Chen, Xueguang Ma, Xinyi Wang, and William W Cohen. 2022. Program of thoughts prompting: Disentangling computation from reasoning for numerical reasoning tasks. arXiv preprint arXiv:2211.12588 (2022).

3. Wei-Lin Chiang, Zhuohan Li, Zi Lin, Ying Sheng, Zhanghao Wu, Hao Zhang, Lianmin Zheng, Siyuan Zhuang, Yonghao Zhuang, Joseph E. Gonzalez, Ion Stoica, and Eric P. Xing. 2023. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality. https://lmsys.org/blog/2023-03-30-vicuna/

4. Aakanksha Chowdhery, Sharan Narang, Jacob Devlin, Maarten Bosma, Gaurav Mishra, Adam Roberts, Paul Barham, Hyung Won Chung, Charles Sutton, Sebastian Gehrmann, 2022. Palm: Scaling language modeling with pathways. arXiv preprint arXiv:2204.02311 (2022).

5. Karl Cobbe, Vineet Kosaraju, Mohammad Bavarian, Mark Chen, Heewoo Jun, Lukasz Kaiser, Matthias Plappert, Jerry Tworek, Jacob Hilton, Reiichiro Nakano, 2021. Training verifiers to solve math word problems. arXiv preprint arXiv:2110.14168 (2021).

Cited by 4 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Machine vs Machine: Large Language Models (LLMs) in Applied Machine Learning High-Stakes Open-Book Exams;Revista de Educación a Distancia (RED);2024-05-30

2. Marking: Visual Grading with Highlighting Errors and Annotating Missing Bits;Lecture Notes in Computer Science;2024

3. Improving the Validity of Automatically Generated Feedback via Reinforcement Learning;Lecture Notes in Computer Science;2024

4. Automated Long Answer Grading with RiceChem Dataset;Lecture Notes in Computer Science;2024