AI新工具
banner

CodeI/O


介绍:

CodeI/O通过将代码推理模式转化为自然语言,提高了大型语言模型的推理能力。









CodeI/O

CodeI/O是一种新颖的方法,通过将基于代码的推理模式转换为自然语言格式,旨在增强大型语言模型(LLM)的推理能力。与传统方法侧重于特定技能不同,CodeI/O系统地提取通用推理原语,同时保持程序的严谨性,从而在各种推理任务中实现更好的性能。

主要特点与贡献:
  1. 通用转换:将多种代码模式转换为自然语言的思维链(Chain-of-Thought)推理。
  2. 语法解耦:将推理过程与代码语法解耦,同时保留逻辑结构。
  3. 多任务增强:提升在符号、科学、逻辑、数学、常识和代码推理等多种任务中的性能。
  4. 全面可验证:支持通过缓存的真实结果匹配或代码重新执行来进行精确预测验证。
  5. 高级迭代:增强版(CodeI/O++)支持多轮修正,以提高准确性。
数据构建流程:
  1. 收集来自各种来源的原始代码文件。
  2. 将这些文件转换为统一格式。
  3. 通过代码执行从变换后的函数中抽取输入输出对(I/O pairs)。
  4. 最终组装完整的训练数据集,包括统一格式中的元素和从大型语言模型中收集的响应。
学习流程:

模型训练采用两阶段方式:第一阶段在CodeI/O(增强版)上训练,第二阶段在通用的SFT数据上训练,以增强模型的推理能力,同时保持其对一般指令的遵循能力。

总之,CodeI/O通过将代码与推理模式进行有效结合,推动了LLM在多种推理任务中的应用和发展。

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621