AI新工具
banner

AutoCoder


介绍:

AutoCoder是一种新型代码生成模型,能自动安装所需包并运行代码。









AutoCoder

AutoCoder简介

AutoCoder是一个专为代码生成任务设计的新模型,其在HumanEval基准数据集上的测试准确率超越了GPT-4 Turbo(2024年4月版本),达到90.9% vs 90.2%。与之前的开源模型相比,AutoCoder增加了一个新功能:能够自动安装所需的软件包,并尝试运行代码直到确认没有问题,这在用户希望执行代码时特别有用。

功能和特点对比
  • 与GPT-4 Turbo相比:GPT-4 Turbo无法访问外部库,而AutoCoder则能够自动安装所需的软件包,这使得AutoCoder的代码解释器应用范围更广。
  • 与现有开源代码解释器相比(如OpenCodeInterpreter):AutoCoder的代码解释器只在用户需要验证代码时调用,而OpenCodeInterpreter会运行所有生成的Python代码。
模型及使用场景

AutoCoder及其简化版本AutoCoder-S可以在Huggingface上获取:

基础模型是deepseeker-coder。

快速开始
  1. 创建conda环境:
conda create -n AutoCoder python=3.11
conda activate AutoCoder
pip install -r requirements.txt
  1. 测试HumanEval:
cd Evaluation
python test_humaneval.py

会生成一个名为AutoCoder_HumanEval+.jsonl的文件,可以使用EvalPlus的测试框架查看结果。

  1. 测试MBPP:
python test_mbpp.py
python postprocess_mbpp.py

生成AutoCoder_Mbpp+-sanitized.jsonl文件后,使用EvalPlus直接测试。

  1. 测试DS-1000:
python test_ds1000.py

生成jsonl文件后,使用DS-1000测试框架进行测试。

  1. Web演示(包含代码解释器):
cd /Web_demo
pip install -r requirements.txt
python chatbot.py
使用场景
  • 代码生成与自动化测试:开发者可以使用AutoCoder自动生成代码,并通过自动安装依赖和验证代码功能进行快速测试。
  • 编程教育:AutoCoder能够为学习编程的用户提供自动化的代码检查和反馈。
  • 数据科学与研究:适用于需要运行和验证大量代码片段的数据科学家和研究人员。
可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621